북 리뷰1 - 부의 추월차선(5) 엠제이 드마코 저 | 신소영 역 1 도서 소개 : 이전 부의 추월차선(1) 포스팅을 통해 간략한 도서 소개를 해두었습니다. 참고해주셨으면 좋겠습니다. ( http://blancby.com/18 ) 2 기억에 남는 글귀들 정리하기 (5) - 성공은 아이디어가 아닌 실행에 있다. - 기회는 불편을 해결하는 데 있다. 기회란 전구나 자동차처럼 엄청난 타개책인 경우는 드물고, 충족되지 못한 욕구나 적절하게 충족되지 못한 욕구같이 간단한 것이다. 기회는 단순화에 있다. 기회는 감정이다. 기회는 편리함이다. 기회는 더 나은 서비스며 고통을 치유하는 것이다. - 누군가 하고 있다고? 멋진 아이디어가 떠올랐는데 누군가 이미 하고 있다면? 뭐 어떤가. 내가 더 잘하면 된다. - '누군가..
1부 분류 2장 k-최근접 이웃 알고리즘 이 알고리즘은 영화를 장르별로 분류할 때 주로 사용하는 알고리즘이다. k-최근접 이웃은 거리측정(distance measurement)의 개념을 활용하게 된다. 장점으로 높은 정확도와 오류데이터(outlier)에 둔감하며 데이터에 대한 가정이 없는 반면 단점은 계산 비용이 높은 반면 많은 메모리를 요구한다고 한다. k-최근접 이웃(KNN)알고리즘은 기존 훈련 집합이었던 예제 데이터 집합이 있다. 모든 데이터에 분류 항목 표시 라벨이 붙어 있으며 각각의 데이터가 어떤 분류 항목으로 구분되는지 알 수 있다. 이후 분류 항목 표시가 붙어 있지 않은 새로운 데이터가 주어졌을 때 기존의 모든 데이터와 새로운 데이터를 비교하게 된다. 그리고 가장 유사한 데이터(가장 근접한 ..
2017년 떠오르는 ICT - 데이터 커머스 (D-Commerce) 디지에코에서 2017년 ICT 10대 주목 이슈를 발표했습니다. 그 중 하나로 데이터 커머스가 손 꼽혔는데요. 빅데이터와 커머스의 만남으로 큐레이션 커머스 시대의 도래를 말하는 것입니다. 즉 고객의 SNS 흔적 등 빅데이터 분석을 기반으로 맞춤형 상품을 제공하고 구매를 유도하는 데이터 커머스로 단순한 상품 추천에서 진화하여 개인 라이프스타일에 맞추어 좋아하는 컨텐츠, 시간대에 맞추어 상품을 추천하고 연관 기업을 연결해주는 중개 플랫폼의 모습으로 진화하고 있다고 합니다. 저번 포스팅에서 "싸이월드는 왜 페이스북이 되지 못했나?"에서 강조했듯이 사용 고객의 데이터 분석과 이를 기반으로 사이트 방향 및 운영이 매우 중요함을 알았습니다. 마찬가..
1부 분류. 통계에서 크게 지도 학습(supervised learning method)과 비지도 학습법(unsupervised learning method)으로 나뉠 수 있다. 목적 변수가 존재하면 지도 학습이고, 목적 변수가 없으면 비지도 학습으로 분석해야 한다. 목적 변수는 종속 변수라고도 불리우며 흔히 Y라는 수식표현을 쓴다. 목적 변수(Y)가 존재할 경우 크게 2가지 형태를 다루게 된다. 명목형 값이냐, 수치형 값을 가지냐에 따라 분석기법이 다르다. 명목형은 주로 범주형이라고도 하며 예로는 참, 거짓과 같은 이분법이나 파충류, 어류, 포유류, 양서류, 식물, 균류 등 몇 가지로 나뉠 수 있는 명목항으로 Y를 지정할 수 있다. 반면 수치형은 0.001, 22, 1000 등의 형태로 목적 변수가 한정..
데이터 마이닝의 상위 10가지 알고리즘 데이터와 데이터 기반 결정을 만드는 것은 중요하다. 머신러닝 인 액션은 "데이터 마이닝의 상위 10가지 알고리즘 (Top 10 Algorithms in Data Mining)"이라는 제목의 논문에서 다루고 있는 내용을 기반으로 저술 되었다. 이 논문은 데이터 마이닝 국제 학회인 IEEE에 제축되어 2007년 12월, 지식 및 정보 시스템 잡지(Journal of Knowledge and Infomation System)에 출간되었다고 한다. 이 논문에서 확인된 알고리즘을 기반으로 쓰여진 책이다. 논문의 데이터 마이닝의 상위 10가지 알고리즘 (Top 10 Algorithms in Data Mining) 1. C4.5(trees)2. k-평균(k-means)3. 지지..
북 리뷰1 - 부의 추월차선 (부자들이 말해 주지 않는 진정한 부를 얻는 방법) - 북리뷰 엠제이 드마코 저 | 신소영 역 1 도서 소개 이른 나이에 자수성가한 엠제이 드마코 저자는 부에 대한 시각을 새롭게 하였다. 요약하자면 부는 자유를 얻고 내가 시간을 통제하는 주체가 되는 것이라고 했다. 천천히 부자되기(직업을 통해 일부 저축을 하거나 투자를 통한 우리가 일반적으로 생각하는 부자되기 프로젝트의 개념)로는 부자가 되기 어렵고 되더라도 50-60대에 이루는 것은 큰 의미가 없다고 한다. 부는 빠르게 모을수록 의미가 있고 그것이 가능함을 몸소 실현한 사람임을 설파하고 있다. 즉 부의 추월차선을 발견하는 것이 중요하고 현재 우리가 실천하고 있는 서행차선을 벗어나 추월차선으로 향하는 노력을 해야한다는 것이다..
생활 속의 빅데이터 1 - 2016년 직구 트렌드 읽기 우리나라 사람들의 해외직구에 대한 관심이 지속적으로 늘고 있다. 소셜 네트워크 버즈를 통해 직구족들의 트렌드가 어떠했는지 살펴보고 현재는 어떻게 변화했는지 살펴보고자 한다. # SNS로 보는 2015년 직구 트렌드 작년 LG CNS SMA 분석에 따르면 SNS BUZZ를 활용한 해외직구 주요 구매 주체 프로파일링을 실시한 결과 인물(호칭)관련 탑 키워드 70%가 '주부'의 입장에서 기술된 호칭이라는 것을 밝혀냈다. "4월에 돌 되는 아들 돌복 한벌 구입했습니다." "저렴해서 저도 애들 커플로 입히고 싶네요." "딸한테두 간지 좔조라 이쁠듯해요." "유산균 사고싶어요. 울 신랑이 과민성대장 증후군이라." "저희 신랑 105 입는데 XL사면 될까요??"..
빅데이터 분석 전문가 가이드 - 리뷰2 # 왜 싸이월드는 페이스북이 되지 못했나? 싸이월드는 세계 최대의 소결 네트워크 서비스라고 해도 무방할 정도였다. 2004년 당시 정확히 싸이월드는 최고 전성기를 누리고 있었고 페이스북은 갓 태어나 걸음마도 시작하지 못한 상태였다. 그런데 지금은 어떠한가? 페이스북은 세계 최고의 소셜 네트워크 서비스가 되었고 싸이월드는 잊혀진 존재가 되어버렸다. 왜 싸이월드는 페이스북이 되지 못했나? 2004년에 싸이월드는 이미 미국시장에 진출해 글로벌 서비스를 추진하고 있었다고 한다. 그런데도 왜 싸이월드는 글로벌 서비스의 지위는 고사하고 국내에서도 경쟁 서비스에 밀려 버린 이유는 무엇일까? 결론부터 말하자면 '데이터 분석 기반의 경영 문화의 부재'때문이라고 말할 수 있다. 즉 ..
빅데이터 분석 전문가 가이드 - 리뷰1 # 데이터의 유형 객관적 사시로서의 데이터를 살펴보면 그 형태에 따라 언어 문자 등으로 기술되는 정성 데이터와 수치 기호 도형으로 표시되는 정량데이터로 구분된다. 지역별 온도 풍속 가우량 처럼 수치로 명확하게 표현되는 정량 데이터는 데이터의 양이 크게 증가하더라도 관리하는 시스템에 저장 검색 분석하여 활용하기가 매우 용이하나, 설문조사의 주관식 응답이나 트위터, 블로그, 페이스북 등에 올린 글 등 정성 데이터의 경우 그 형태 형식이 정해져 있지 않아서 이들을 저장 검색 분석하는 데에 상대적으로 많은 비용과 기술적 투자가 수반된다는 점에서 이 둘을 구분한다. # 지식의 피라미드 데이터 -> 정보 -> 지식 -> 지혜 '데이터'는 존재 형식을 불문하고, 타 데이터와의 ..