본문 바로가기

-54

CentOS7 이슈 : sd_journal_get_cursor() failed 리눅스 마스터가 되는 그날까지 끝없이 공부해보는 HABii입니다 ㅠ__ㅠ 오늘은 messages 로그에 rsyslogd fail로그가 발생해서 알아봤네요 리눅스 서버는 알면 알수록 모르는 것 같은 느낌 @.@ #cat /var/log/messages | grep fail Mar 26 22:47:20 [vm-name] rsyslogd-3000: sd_journal_get_cursor() failed: 'Cannot assign requested address' 도대체 이게 무슨 에러지 'ㅡ'.... 봤보고 모르는 척 하기도 애매하고 찜찜해서 찾아봤어요 rsyslogd는 메세지 로깅을 지원하는 시스템 유틸리티로 일정한 규칙을 통해 메세지를 기록, 관리하는 기능이라고 생각하심 됩니다 rsyslogd는 Cent.. 2020. 3. 27.
[LINUX] 라우팅 설정 변경하기 리눅스 공부 잘 하고 계시나요? 여행블로그를 주로 하다보니 리눅스에 너무 오랜 공백을 가졌네요 ㅠ_ㅠ 더 많은 포스팅을 할 수 있도록 분발해볼게요 +.+ 오늘은 라우팅 설정을 변경하는 법에 대해 공유하려고해요 라우팅(Routing)이란? - 특정 네트워크 안에서 통신 데이터를 보낼 경로를 선택하는 과정으로, 설정 방식에 따라 통신 시간이 지연되기도 단축되기도 한다 우리가 느끼기에 모든 네트워크는 하나로 이루어져있는 것 같지만, 사실은 라우터를 통해 다른 네트워크와 연결되어 있습니다! 가정집에서는 통신사에서 구매한 공유기가 보통 라우터 역할을 하고 있고 리눅스 서버를 다루시는 분들은 라우팅 테이블을 이용하거나 방화벽을 사용해 차단할 수 있어요 그럼 다른 네트워크와 붙기 위해 이제 본격 라우팅 설정을 해볼까.. 2020. 3. 14.
데이터 분류(3) - 다른 방법들 Alternative Techniques - 1 Data Classification의 대표적인 예로 Decision Tree base methods를 소개했었다. 그런데 데이터 분류(1) - 기본개념에서 Data Classifier로 아래 항목을 소개했던 바 있어 추가 Decision Tree 외 항목을 끄적여본다! 1. Rule-based Classifier (규칙기반 분류기) - "if... then..." Rule을 사용해 항목을 분류하는 기법을 사용한다. - Rule : Condition -> y condition = 규칙전항(선결조건)으로 속성 시험들의 결합항을 포함 y = 규칙 후항으로 class label [ Rule-based Classifier Example_1 ] R1 : (Given Birth= no)^(Can Fly=yes) ->.. 2020. 1. 8.
데이터 분류(2) - 의사결정 트리 Decision tree(의사결정 트리)는 단순하면서 가장 널리 이용되고 있는 분류 기법으로, 일련의 질문들과 가능한 대답들로 이루어진 트리 형태의 구조를 가지며 트리는 3종류의 노드를 갖는다. Decision Tree에서 각 terminal node에는 하나의 class label이 붙는다. root와 다른 internal node들을 포함하는 non-terminal node(비단말 노드)들에는 서로 다른 특성을 갖는 특성들을 갖는 레코드들을 분리시키기 위한 속성 시험조건들이 들어간다. ex) 포유류 판별 기준 1. 체온이 따뜻한가 차가운가? (따뜻) 표유류, (차가움) 비표유류 2. 분만이 가능한가? (가능) 포유류, (불가능) 비포유류 3. ... etc Hunt's Algorithm (헌트 알고리.. 2020. 1. 2.
데이터 분류(1) - 기본개념 Classification(분류)은 각각의 속성 집합 x를 미리 정해진 class lable 중 하나인 y에 mapping하는 target function을 학습하는 작업이다. - 분류 작업의 입력 데이터 : 레코드(=instance=example)들의 집합 - 각 레코드는 투플(x,y)로 볼 수 있으며 x는 attribute set(속성 집합), y는 category(범주) 또는 target attribute(목표 속성)으로 불리는 class label을 의미하는 특별한 속성 * 분류의 목표는 클래스가 결정되지 않은 레코드에 대해 되도록 정확한 클래스를 부여하는 것 단, class label은 개별적이어야 한다. y가 연속적인 속성을 가지는 예측 모델링 작업인 regression(회귀)과 분류를 구분하.. 2019. 12. 29.
데이터 탐색 Data Exploration(데이터 탐색)은 본격적인 분석에 앞서 수행하는 데이터에 대한 사전조사로 적절한 전처리와 데이터 분석 기법을 선정하는데 도움을 주며 데이터 마이닝으로 해결하는 전형적인 의문에 대한 답을 찾게도 한다. 때문에 이번 포스팅에서는 요약 통계, 가시화, 온라인 분석처리(OLAP)를 통해 데이터 탐색을 공부해보려한다! [지나가며] 통계학의 EDA:Exploratory Data Analysis(탐색형 데이터 분석)과 비슷하게 가시화를 강조하고 있지만, EDA는 가설기반 검정을 최종 목표로 가지기 때문에 사용하는 목적은 다르다고 할 수 있다 ㅁ 아이리스 데이터 집합 데이터 탐색을 설명하기 위해 아이리스 데이터를 이용한다. 각 50개인 3종, 즉 150개의 아이리스 꽃으로 구성되는데 이 꽃.. 2019. 12. 9.
유사도와 비유사도의 척도 유사도와 비유사도는 군집화, 최근접 이웃 분류, 이상치 탐지 등의 다양한 데이터 마이닝 분야에 사용되기 때문에 매우 중요하다. 편의상 유사도나 비유사도를 모두 지칭하기 위해 근접도(Proximity)란 용어를 사용하겠다. 1. 정의 - Similarity (유사도) : 두 object의 닮은 정도에 대한 수치적인 척도로 대개 음이 아닌 수로 보통 0과 1 사이의 값을 갖는다. (0 : 유사도 없음, 1: 완전히 유사) - Dissimilarity (비유사도) : 두 object의 다른 정도에 대한 수치적인 척도로 object의 쌍이 좀 더 닮을수록 낮아진다. distance(거리)라는 용어가 자주 비유사도에 대한 동의어로 사용된다. 2. 변환 - 종종 유사도를 비유사도로, 또는 그 역으로 변환하거나 근접.. 2019. 11. 27.
데이터 전처리의 단계 ㅁ 데이터 전처리(Data Preprocessing)란? - 데이터의 품질을 개선하거나 DataMining에 적합한 형태로 원시 데이터를 변환하는 기법 데이터 전처리는 광범위한 분야이고 서로 복잡하게 관련된 여러 전략 기법으로 구성되어 있고 그 중 일부에 대해 공부할 예정이다. 지금 공부할 항목들은 분석을 위한 Data Object와 Attribute를 선택하는 작업과, Attribute를 생성/변경하는 작업의 두 범주로 나뉜다. 1. Aggregation(통계) : 두개 이상의 객체를 하나의 단일 객체로 결합하는 경우로 특정 Attribute를 통해 통합된다. ex) 날짜에 대한 값을 365일에서 12개월, 12개월을 1년으로 줄일 수 있다. : Aggregation(총계)에 대한 동기는 여러가지로 볼.. 2019. 11. 26.
데이터 품질 데이터 마이닝의 결과는 다양한 곳에 응용될 수 있다. 그 데이터들이 오로지 데이터 마이닝을 위해서 수집된 정보만은 아닐 것이다. 통계학의 여러 분야에서는 미리 지정된 수준의 데이터 품질을 달성하는 실험이나 조사의 설계를 다루며 데이터 품질 문제를 방지하는 것이 선택사항이 아니기 때문에, 데이터 마이닝은 데이터 품질문제의 검출과 수정, 저급 데이터 품질을 감내할 수 있는 알고리즘 사용에 치중한다. 1. 측정과 데이터 수집 오류 측정오류(Measurement error) : 측정 과정에서 비롯된 문제 Data Collection Error(데이터 수집 오류) : Data Object와 Attribute(속성) 값을 빼먹거나 데이터 객체를 부적절하게 포함시키는 오류 ※ 임의로 오류를 낼 수도 있긴 하다~ 2... 2019. 11. 24.