티스토리 뷰

대체 왜...??




사진 출처: Silicon Valley : Season 4 Episode 4 : Not Hotdog



안녕하세요, 이번에 딥러닝과 빅데이터 시리즈를 시작하는 윤이라고 합니다. 딥러닝과 빅데이터? 컴퓨터, 특히 프로그래밍 쪽에 관심 있으신 분은 많이 들어봤을 겁니다. 그렇지 않은 분들도 인공지능이라는 단어는 들어보셨을 법한 게 최근 들어 해외에서 화두가 되고 있는 아마존 알렉사, 그리고 국내 KT의 기가 지니도 인공지능, 특히 딥러닝을 사용하거든요. 알렉사 같은 경우에는 아마존의 성장을 이끌어가는 주된 상품중 하나죠. Business Insider에 따르면 2020년까지 알렉사와 관련된 제품에서 비롯된 수익이 $11B, 한화로 약 13조가 된답니다.


사진 출처 : Business Insider


또한 MarketWatch에 따르면 2016년 부터 2022년까지 딥러닝 시장이 매년 65.3%의 성장률을 보이며 2022년에는 $1.8B의 시장가치를 지닙니다. 시장의 크기가 중요한게 아니에요. 매년 65.3% 성장률이 중요합니다. 이 성장률이면 단순 계산으로 5년동안 기존 크기에서 12배 만큼 파이가 커집니다. 단순하게 비교를 해볼까요? 페이스북은 최근 5년동안 마켓캡이 9배, 아마존은 5배, 구글은 2배 그리고 애플은 1.6배 증가했습니다. 느낌이 오시나요? 물론 규모의 차이가 있기에 정확한 비유는 되지 않습니다만 65.3% 성장률이 어떤 임팩트인지 감이 오셨으면 합니다. 이게 다가 아닙니다. Forbes에 의하면 2020년까지 빅데이터 시장은 $203B, 한화로 약 220조의 시장가치를 지닌답니다. 2016년 한국 총 세수가 233조 이니.. 한 나라의 세금과 크기가 비슷하네요. 하지만 저는 돈을 보고 딥러닝과 빅데이터를 배우는게 아닙니다. 그럼 대체 왜?


재밌고 신기하잖아요


딥러닝을 배우다보면 사물인식 그리고 얼굴인식에 대해 배웁니다. 첫번째 사진도 딥러닝을 통해 핫도그인지 아닌지를 구별하는 앱을 만든겁니다. 그리고 사람들이 어디에 재밌게 응용했나 찾아봤더니, 아니 글쎄, 다음 영상에서 보시다시피 눈에다가 레이저 쏘는 기계를 만든 사람도 있네요



영상 출처 : Youtube


 얼굴인식 뿐만이 아닙니다. 요번 6월 15일에 구글이 TensorFlow Object Detection API를 새로 내놓았는데 이게 사물 인식률이 무척 뛰어납니다. 



출처 : Priya Dwivedi


를 바탕으로 한 응용 창작물은 무궁무진 합니다. 시각 인식 뿐만이 아니라 소설, 영화, 음악 쪽에서도 딥러닝이 응용되고 있습니다. 아직까지 실험 단계지만 딥러닝을 통해 해리포터 소설을 창작하거나, 영화 편집 아니면 음악 제작을 딥러닝 알고리즘에 맡긴다던지. 하지만 아셔야할게 딥러닝은 사람들이 인식하기 어려운 패턴, 선이나 곡선, 색, 명암의 차이, 단어와 단어들의 숫자적 관계 등을 하나하나 다 분석합니다. 이 방대한 패턴들이 빅데이터가 되어 딥러닝 알고리즘이 수행할 수 있는 바탕이 됩니다. 모든 빅데이터를 딥러닝으로 분석할 필요는 없습니다. 예를들어 타이타닉에서 각 탑승자들의 나이와 탑승 클래스등 여러 요인에 따른 생존도를 비교하는데 딥러닝보다는 머신 러닝 알고리듬, 예를 들어 랜덤포레스트(RandomForest)를 사용는게 좀 더 효율적입니다.


사진 출처 : Kaggle (Introduction to Ensembling/Stacking in Python)


위 그래프에서 볼 수 있다시피 타이타닉 생존도에 성별과 가족크기가 무척 중요하다는 것을 알 수 있습니다. 모델 훈련에 사용되는 데이터가 891개 밖에 없기에 빅데이터라고 하기엔 무리가 있습니다만 왜 딥러닝이 필요치 않고 적절한 머신러닝 알고리즘이면 충분한지 아셨으면 합니다.


저도 배우는 입장에서 여러 이 시리즈를 작성하기에 많은 오류가 있을거고 명확히 알지 못하는 이론과 컨셉을 설명하려고 하기 때문에 정확하지 않은 설명이 있을 수 있습니다. 만약 오탈자나 제가 설명한 이론이 본인이 아는것과 다르다면 댓글을 달아주세요. 틀린 경우에 바로 시정하겠습니다!

많은 사람들이 딥러닝과 빅데이터를 배웠으면 하는 마음에 하나하나 설명을 더해가며 진행할 예정입니다. 다음 시리즈는 macOS Sierra 10.12.6버젼에 Python 3.5.2와 TensorFlow, 그리고 Jupyter Notebook 설치하는 과정을 올리겠습니다. 


'딥러닝' 카테고리의 다른 글

텐서플로 - 설치  (0) 2017.08.01
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/03   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함