본문 바로가기

Make the Learning Curve48

[Deep Learining] 텐서플로우-케라스 신경망을 이용한 선형회귀분석 [코드 분석] 모듈 불러오기 import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Input, Dense from tensorflow.keras import initializers # y = 3*x1 + 5*x2 + 10 [모델 생성] input data가 2개 hidden layer의 뉴런 16개 따라서 2*16 + 16(bias) = 48개입니다. def generator_sequential_model(): model = Sequential( [ Input(2, name = 'input_layer'), #첫 Layer에서 2개의 변수로부터 값을 받고 Dense(16, act.. 2020. 11. 30.
[Deep Learning] What is D/L? 딥러닝이란? 딥러닝이란 무엇인가? 딥러닝 알고리즘은 여러 계층의 계층 구조를 사용하여 표현을 학습(복수 수준)하려고 시도함 시스템에 엄청난 양의 정보를 제공하면 다음과 같은 작업이 시작됨 그것을 이해하고 유용한 방법으로 대응한다. 효과적인 엔드 투 엔드 공동 시스템 학습 대량의 교육 데이터 활용 딥러닝은 시각적, 언어적 정보를 표현하기에 매우 유연하고 학습 가능한 프레임워크를 제공한다. 딥러닝이 가장 혁신을 이루어낸 분야 : 이미지처리, 자연어(NLP)처리 (네이버 papago) 2010년 이후 Deep Neural Network로 인해 Deep Learning이 다시 각광을 받고있다. 그 이유는 크게 두 가지로 뽑을 수 있다. 첫째, 굉장히 많은 데이터가 사용가능하게 되었고, 둘째, 병렬처리 도구, 환경이(GPU .. 2020. 11. 25.
K-Means Algorithms 1) 랜덤으로 K개 벡터 선택 2) 선택되지 않은 벡터들(검은색)을 선택 된 K개 벡터에 가까운 벡터에 할당(assign)한다. 3) 빨강, 파랑의 벡터들의 centroid를 각 각 계산한다. -> 빨강색 X(centroid) 지점과 파랑색 X지점을 찾을 수 있다. 4) 위에서 구한 centroid에서 reassign 진행한다. ( 각 각의 centroid에 가까운 벡터들을 assign) 5) reassign한 후 빨강, 파랑의 벡터들의 새로운 centroid를 각 각 계산한다. 6) 4,5 과정을 계속해서 반복한다. centroid의 변화가 없을때까지 ( 계속 된 reassign에도 일치되는 centroid 찾을 때까지) 반복한다. centroid의 변화가 없고 반복이 멈추었다면, 최종으로 두개(k개).. 2020. 11. 24.
[M/L - Classification]Logistic Regression (feat. Linear Regression) Machine Learning 에는 지도학습( Supervised Learning)과 비지도학습(Unsupervised Learning)이있다. 여기서 지도학습에는 Regression(회귀)와 Classification(분류)가 있다. 두 가지의 특징을 간단히 알아보자. 두 가지 특징을 알기에 앞서 독립변수와 종속변수의 개념을 알아야한다. 일반적으로 독립변수는 주어진 데이터 값 ( x 값) , 종속변수는 독립변수에 의해 영향을 받는 값 (y 값) 이렇게 표현할 수있다. Regression (회귀) 독립변수에 대해서 종속변수 값이 연속형(Continuous) 값으로 나타난다. 독립변수 모델링을 통해 종속변수를 구하고 실제 값을 예측하는 것 ex) [키 185cm, 162.7cm] [온도 : 25.3도 , .. 2020. 11. 24.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 사이킷런 사이킷런을 함축해서 표현할 수 있는 표 (Cheat-Sheet)이다. 크게 4가지로 구분할 수 있다. 1) Classification (분류) 2) Regression (회귀) 3) clustering (군집화) 4) Dimensionality Reduction (차원 축소) 1) Classification은 분류하는 것으로써 시험에서 (합격 / 불합격) 혹은 점심을 (먹음 / 먹지 않음) (학생이다 / 학생이 아니다) 등을 측정하며 이용한다. 2) Regression은 회귀로써, x와 y값 선형관계를 파악하는 것이다. 독립변수(x값)데이터에 따라서 종속변수(y값)가 얼마나 변하는지에 대한 예측에 이용한다. 이 부스트코스 - 캐글 실습 캐글 실습으로 배우는 데이터 사이언스에서 실습하고있는 자전거 데이터 .. 2020. 11. 23.
if (kakao) 2020 - 카카오페이 DevOps의통합과 자동화에 관한 이야기 - 리뷰 개발자들은 단순 반복 일에대한 거부감이 있다. 첫 번째로, 동일한 소스코드를 작성한다면, 비효율적이고 재미없고 실수를 유발하여 에러가 발생할 수 있기 때문이다. 두 번째로, 같은 코드를 여기저기(A, B, ... Z)에서 구현하여 관리해하기때문에 A에서 수정을하면 B에서도, ... Z까지에서도 모두 수정을하고 관리를 해야한다. 따라서 그만큼 장애 포인트가 늘어남에 따라 에러발생 확률도 높아진다. 이러한 일들을 막기 위해 첫 번째 문제는 자동화로, 두 번째의 문제는 통합으로 관리를 한다고 하셨다. 카카오페이 DevOPs 1) Container : 온프레미스 환경위에 자체적으로 구현한 쿠버네티스(Kubernetes) 컨테이너 환경운영, 컨테이너 환경이 아닌 온프레미스 환경에서 서비스 운영 2) Deploy .. 2020. 11. 19.
Naver Deview 2020 참가신청 Deview2020 신청이 오픈되었습니다! deview.kr/2020 DEVIEW 2020 DEVIEW는 국내외 개발자들이 서로의 지식을 나누고, 탁월함을 추구하며, 함께 성장하는 컨퍼런스 입니다. DEVIEW 2020 deview.kr 참가 신청은 아래 링크를 통해 하실 수 있습니다 booking.naver.com/booking/5/bizes/103266 네이버 예약 :: DEVIEW 2020 최고의 기술과 경험을 공유하며 개발자들이 함께 성장하는 자리! DEVIEW는 서로의 지식을 나누고 탁월함을 추구하며 함께 성장하는 개발자 컨퍼런스 입니다. 11월 25일~ 11월 27일, 온라인으로 진행 booking.naver.com 네이버 DEVIEW 2020 -기간 : 2020. 11. 25(수) - 202.. 2020. 11. 19.
if (카카오) 2020 추천 시스템, 써보지 않겠는가? - Review if.kakao.com/session/125 if(kakao)2020 오늘도 카카오는 일상을 바꾸는 중 if.kakao.com if(카카오) 2020을 통해 컨퍼런스를 시청하고있습니다. 그 중 머신러닝을 이용한 카카오 재팬- 픽코마의 추천 시스템을 소개해주시는 영상을 보았습니다. 홈추천 - 홈화면에서 유저에게 개인화 된 에게 추천 뷰와인드(?) 추천 - 한 작품(웹툰)을 완주했을때, 그 작품과 비슷한 작품을 추천 그리고 팝업 추천을 중점적으로 소개해 주셨습니다. 팝업 추천이란? -> 팝업 형태로 작품을 노출 시켜주는 시스템이다. 팝업 추천 사용 이유 -> 사업 전략적 측면에서 특정 작품의 소비를 늘리기 위해서 팝업 추천을 통한 노출 횟수를 증가 하지만, 팝업 추천에 문제점으로 유저의 동선을 가로막는 문제.. 2020. 11. 18.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 자전거 수요량 예측 공유 자전거 수요량 예측(Bike Sharing Demand) 1. data set을 다운로드 받습니다! www.kaggle.com/c/bike-sharing-demand/data Bike Sharing Demand Forecast use of a city bikeshare system www.kaggle.com 2. 저는 Jupyter Notebook을 사용했습니다. 3. 문제 파악 : Regression (회귀)분석 모형입니다. 머신러닝의 지도 / 비지도 학습 중 지도 학습입니다. 왜냐하면, 특정상황에 따른 count가 존재하기 때문에 회귀(Regression)분석 문제입니다! (참고)쥬피터노트북에서 밑에 Shell을 추가할때, ESC + B 버튼을 누르면 밑에 Shell이 추가됩니다! 또한 위에 S.. 2020. 11. 3.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 안녕하세요? 에이도입니다! 이번에 저는 부스트코스 - 캐글 실습으로 배우는 데이터 사이언스를 수강하고 있습니다! 부스트코스에서는 강의를 듣고, 퀴즈를 풀며 수강을 진행하는 포맷으로 진행되고 있는데요! 여기서 퀴즈가 가끔 헷갈려서 틀리는 경우가 많더라구요! 저도.. 몇 번 틀리고 하다보니.. 도움을 찾고자 하는 마음이 생기게 되어서 제가 이 퀴즈를 공유해보면 어떨까? 싶어서 퀴즈 정답을 공유하게 되었습니다! 이 퀴즈는 Quiz 1으로, 설문조사 분석과 시각화 강의의 퀴즈 정답입니다!! 모두 밑에 정답 참고하셔서 부드러운 수강 진행 하시길 바랄게요!! 제가 로또 프로젝트를 하면서 dataframe 값이 nan으로 나왔을 때, 어려움을 겪었었는데 그때 Nan을 어떻게 처리하나 고민고민하며 구글과 stackov.. 2020. 11. 3.
[부스트코스] 네이버 부스트코스 시작 (2020. 9. 26.) 요근래에 개발자가 되기 위해서 CS공부를 어떻게 해야할까 정말 많은 고민을 했다. 현재 전공에서는 배우지 못하였기때문에, 부전공으로 컴퓨터공학을 이수하게되면 졸업이 너무 늦어질까 걱정이였다. 그래서 유튜브, 구글 검색등으로 영상을 보고 블로그를 참고하며 조금씩 조금씩 로드맵을 그리고 학교 e캠퍼스 데이터베이스, 알고리즘 수업을 청강 신청하였다. 이번 여름에 신청했던 네이버 - 오픈클래스 자료들을 다시한번 훑어보며 실무자님의 "부스트캠프 경험"이 눈에 들어와 검색해보고 네이버 - 부스트캠프를 알게 되었다. 이번 부스트캠프는 이미 종료가 되었기 때문에 내년에 기회가 된다면 도전해 보고싶다. 아무튼 이 부스트캠프를 검색하다가 우연히 "부스트코스"를 알게되었다. 갓네이버.. 정말 '노.. 2020. 11. 3.
py print('Hello, Tistory') 2020. 10. 29.