Skip to content

Commit

Permalink
KerasKorea#38 Add Keras와 텐서플로우를 이용한 손글씨 인식.md
Browse files Browse the repository at this point in the history
  • Loading branch information
jhp committed Aug 28, 2018
1 parent 2965db0 commit 0fa7d56
Show file tree
Hide file tree
Showing 2 changed files with 50 additions and 0 deletions.
25 changes: 25 additions & 0 deletions 38_Keras와 텐서플로우를 이용한 손글씨 인식.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
## Keras와 텐서플로우를 이용한 손글씨 인식(Handwriting recognition using Tensorflow and Keras)
[원문 링크](https://towardsdatascience.com/handwriting-recognition-using-tensorflow-and-keras-819b36148fe5)
> 이 문서는 CNN 과 softmax classification loss 를 이용해서 영어 손글씨 데이터를 인식해보는 것에 대해서 설명합니다.
* CNN
* softmax classification loss

<br></br>
![figure1](https://cdn-images-1.medium.com/max/1600/1*mCjhzOF1Gsr7eURlIIozUg.gif)

### Introduction
writer 가 직접 작성한 각 문서를 분류하는 손글씨 인식은 사람마다 글씨 스타일의 큰 차이로 인해 어려운 문제입니다.
손글씨 인식에 대한 접근 방식은 언어의 독립적인 특징(feautre)를 추출하는 것입니다. 글씨의 독립적인 특징에는
글자의 굴곡(휘어진 정도- 쉽게 말하면 글씨체라고 생각하면 될 것 같네요.), 공백, b/w 문자가 있습니다. 그러고나서 writer 별로 구분할 수 있도록 SVM 과 같은 분류기를 사용합니다. 이 글에서는, 이러한 기능을 식별하는 딥러닝 기반 접근 방식을 보여드리고자 합니다. 우리는 손으로 쓴 작은 이미지 조각들을 CNN에 전달하고 손실함수로서 softmax classification loss를 사용해서 모델을 학습시킬 것입니다.

이 기술의 효과를 보여주기 위해서, 영어 손글씨 데이터를 분류하는 데 사용하기로 해요.

[여기](https://github.com/priya-dwivedi/Deep-Learning/blob/master/handwriting_recognition/English_Writer_Identification.ipynb)에서 모든 코드를 확인할 수 있습니다.

#### Getting our data_format

IAM 손글씨 데이터베이스는 영어 손글씨 이미지 데이터 셋 중 가장 큰 데이터베이스입니다.

### 참고사이트
[tensorflow-hangul-recognition](https://github.com/IBM/tensorflow-hangul-recognition/blob/master/README-ko.md#2-이미지-자료-생성하기)
25 changes: 25 additions & 0 deletions 38_케라스와 텐서플로우를 이용한 손글씨 인식.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
## 케라스와 텐서플로우를 이용한 손글씨 인식(Handwriting recognition using Tensorflow and Keras)
[원문 링크](https://towardsdatascience.com/handwriting-recognition-using-tensorflow-and-keras-819b36148fe5)
> 이 문서는 CNN 과 softmax classification loss 를 이용해서 영어 손글씨 데이터를 인식해보는 것에 대해서 설명합니다.
* CNN
* softmax classification loss

<br></br>
![figure1](https://cdn-images-1.medium.com/max/1600/1*mCjhzOF1Gsr7eURlIIozUg.gif)

### Introduction
writer 가 직접 작성한 각 문서를 분류하는 손글씨 인식은 사람마다 글씨 스타일의 큰 차이로 인해 어려운 문제입니다.
손글씨 인식에 대한 접근 방식은 언어의 독립적인 특징(feautre)를 추출하는 것입니다. 글씨의 독립적인 특징에는
글자의 굴곡(휘어진 정도- 쉽게 말하면 글씨체라고 생각하면 될 것 같네요.), 공백, b/w 문자가 있습니다. 그러고나서 writer 별로 구분할 수 있도록 SVM 과 같은 분류기를 사용합니다. 이 글에서는, 이러한 기능을 식별하는 딥러닝 기반 접근 방식을 보여드리고자 합니다. 우리는 손으로 쓴 작은 이미지 조각들을 CNN에 전달하고 손실함수로서 softmax classification loss를 사용해서 모델을 학습시킬 것입니다.

이 기술의 효과를 보여주기 위해서, 영어 손글씨 데이터를 분류하는 데 사용하기로 해요.

[여기](https://github.com/priya-dwivedi/Deep-Learning/blob/master/handwriting_recognition/English_Writer_Identification.ipynb)에서 모든 코드를 확인할 수 있습니다.

#### Getting our data_format

IAM 손글씨 데이터베이스는 영어 손글씨 이미지 데이터 셋 중 가장 큰 데이터베이스입니다.

### 참고사이트
[tensorflow-hangul-recognition](https://github.com/IBM/tensorflow-hangul-recognition/blob/master/README-ko.md#2-이미지-자료-생성하기)

0 comments on commit 0fa7d56

Please sign in to comment.