본문 바로가기

분류 전체보기446

데이터 분류(1) - 기본개념 Classification(분류)은 각각의 속성 집합 x를 미리 정해진 class lable 중 하나인 y에 mapping하는 target function을 학습하는 작업이다. - 분류 작업의 입력 데이터 : 레코드(=instance=example)들의 집합 - 각 레코드는 투플(x,y)로 볼 수 있으며 x는 attribute set(속성 집합), y는 category(범주) 또는 target attribute(목표 속성)으로 불리는 class label을 의미하는 특별한 속성 * 분류의 목표는 클래스가 결정되지 않은 레코드에 대해 되도록 정확한 클래스를 부여하는 것 단, class label은 개별적이어야 한다. y가 연속적인 속성을 가지는 예측 모델링 작업인 regression(회귀)과 분류를 구분하.. 2019. 12. 29.
보라카이 여행 '◡'✿ - 인천공항 스파온에어 찜질방 얼마 전 보라카이에 큰 태풍이 지나갔죠 ㅠㅠ 저희도 보라카이 여행 일정 중 태풍이 있었는데 다행히도 태풍 상륙일 새벽에 한국에 도착했습니다 .. 사이렌이 울리고 얼른 나가라고 재촉하셔서 경황없이 나오게 되었고, 당시 상황에 대해서는 보라카이 여행 포스팅을 하며 천천히 이야기해볼게요 시간의 흐름에 따라 천천히 포스팅 해나가려하니 필요한 내용에 맞게 보심 될 것 같아요 !! 저희는 새벽 06시 55분 비행을 예정하고 있었어요 :) 때문에 당일 출발은 너무 힘들 것 같더라구요 ㅠㅠ 공항 주변의 호텔 등을 이용하기엔 가성비가 좋지 않은 것 같아 인천공항 [SPA ON AIR 찜질방]을 이용하기로 결정! 새벽 비행관련해서 항공사와 항공료 등은 아래와 같구요 자세한 내용은 링크에서 확인하실 수 있습니다! >> CL.. 2019. 12. 29.
데이터 탐색 Data Exploration(데이터 탐색)은 본격적인 분석에 앞서 수행하는 데이터에 대한 사전조사로 적절한 전처리와 데이터 분석 기법을 선정하는데 도움을 주며 데이터 마이닝으로 해결하는 전형적인 의문에 대한 답을 찾게도 한다. 때문에 이번 포스팅에서는 요약 통계, 가시화, 온라인 분석처리(OLAP)를 통해 데이터 탐색을 공부해보려한다! [지나가며] 통계학의 EDA:Exploratory Data Analysis(탐색형 데이터 분석)과 비슷하게 가시화를 강조하고 있지만, EDA는 가설기반 검정을 최종 목표로 가지기 때문에 사용하는 목적은 다르다고 할 수 있다 ㅁ 아이리스 데이터 집합 데이터 탐색을 설명하기 위해 아이리스 데이터를 이용한다. 각 50개인 3종, 즉 150개의 아이리스 꽃으로 구성되는데 이 꽃.. 2019. 12. 9.
남양주 맛집 :: 가성비 갑 한정식, 김삿갓 밥집!! 겨울놀이를 위해 신나게 강원도 홍천에 다녀왔어요!! 오랜만에 운동을한지라 온몸이 뻐근하네요 :( 고생했으니 돌아오는 길에 맛있는 저녁을 먹고자! 후니가 알고있던 맛집에 데려가줬어요 맛있는 집일거라는 기대는 하고있었는데, 생각보다 더 맛집이고 친절했었어서 추천해드리려고 해요:) [김삿갓밥집] 경기 남양주시 경춘로 1158 (매주 월요일 휴무) 영업시간 : 매주 화~금 11:30 ~ 18:00 (Last Order 17:00) 매주 토~일 11:30 ~ 21:00 (Last Order 20:00) 공휴일 11:30 ~ 21:00 (Last Order 20:00) Break Time 15:00 ~ 17:00 (요일 무관) (주차 가능) 김삿갓 밥집은 간판이 굉장히 커요! 그래서 멀~~리서부터 '아 저기구나' .. 2019. 12. 8.
남양주팔당 야경 맛집 :: 벨스타커피 드라이브하면 남양주, 남양주하면 팔당이죠? 많은 사람들이 방문하는 팔당 야경 맛집을 소개해보려고해요 [벨스타커피] 경기 남양주시 와부읍 다산로 46 영업시간 : 10:00 ~ 02:00 (연중무휴) 주차장 있음 지도에서도 보이듯 한강뷰를 제공하는 카페구요 카페지만 파스타/피자도 판매해서 식사까지 가능합니다 :) 저희는 식사를 목적으로 벨스타 커피에 다녀왔어요 벨스타 커피는 총 2개 층(1층/지하?)으로 이루어져있구요 아래층에서는 대부분 커피음료를 마시는 것으로 보였고 위층에서는 식사하시는 분들이 많더라구요 음료/식사 모두 1층에서 주문을 받다보니 비교적 움직이기 편한 1층에서 식사를 하시는 것 같았어요 벨스타 커피 입구에요 화려하죠? 저녁에 방문해서인지 더 화려했던 것 같아요 주차장에 주차를 하고나면 반.. 2019. 11. 28.
유사도와 비유사도의 척도 유사도와 비유사도는 군집화, 최근접 이웃 분류, 이상치 탐지 등의 다양한 데이터 마이닝 분야에 사용되기 때문에 매우 중요하다. 편의상 유사도나 비유사도를 모두 지칭하기 위해 근접도(Proximity)란 용어를 사용하겠다. 1. 정의 - Similarity (유사도) : 두 object의 닮은 정도에 대한 수치적인 척도로 대개 음이 아닌 수로 보통 0과 1 사이의 값을 갖는다. (0 : 유사도 없음, 1: 완전히 유사) - Dissimilarity (비유사도) : 두 object의 다른 정도에 대한 수치적인 척도로 object의 쌍이 좀 더 닮을수록 낮아진다. distance(거리)라는 용어가 자주 비유사도에 대한 동의어로 사용된다. 2. 변환 - 종종 유사도를 비유사도로, 또는 그 역으로 변환하거나 근접.. 2019. 11. 27.