목록전체 보기 (338)
DevSSOM
WHERE : 검색하고자 하는 데이터의 조건을 설정해서 검색할 때 사용하는 명령. * SELECT와 WHERE의 차이? -> 'SELECT + 컬럼명', 'WHERE + 데이터(레코드)' 이렇게 사용함. 0) DESC : 테이블의 구조 DESC book; 1) 책 정보를 저장하는 book 테이블에서 작가 이름이 'Joanne Kathleen Rowling'인 책만 골라서 검색하기 SELECT * FROM book WHERE author = 'Joanne Kathleen Rowling'; 조건이 여러 개 일 때 비교 연산자 >, =, A가 10과 20 사이에 포함된 값 (10, 20도 포함) IN : A IN B -> B가 A에 포함된 값 NOT IN : A NOT IN B -> B에 A가 포함되지 않은 ..
테이블의 구성요소 테이블은 컬럼(Column)과 레코드(Record)로 구성됨. 컬럼은 열, 레코드는 행을 얘기함. 아래 예시 테이블에서는 사번과 이름, 성별이라는 3개의 컬럼이 있고, 001, 002, 003, 홍길동, 김철수, 김영희, 남성, 남성, 여성 처럼 써있는 레코드가 있음. 보통 컬럼은 주제, 제목 같은 것이고, 레코드는 내용과 값이 들어간다고 이해하면 됨. 아래를 보면, book 테이블, rental 테이블, user 테이블 이렇게 각각의 이름이 있고, 이 이름을 기준으로 데이터를 불러올 수 있음. 테이블에서 데이터 검색하기 책 정보를 저장하는 book테이블에 저장된 책의 제목(title)과 저자(author)를 검색해보기. SQL 기본 문법 데이터를 검색하기 전에 알아야 할 SQL의 3가..
데이터베이스(DB)? 여러 사람이 공유해 사용할 목적으로 통합하여 관리하는 데이터의 모음. 마리아 DB, 아마존 Redshift, 오라클 DB 등 많은 종류가 있는데, 모든 데이터베이스에 대해 알 필요는 없음. 데이터베이스의 종류에 따라 사용 방법이 조금씩 다르긴 하지만, 데이터베이스에서 검색과 분석에 사용되는 기본 방법은 데이터베이스의 종류와 상관없이 동일함. 데이터베이스의 종류 데이터베이스는 다양한 종류가 있지만, 가장 많이 사용되는 종류는 1) 관계형 DB와 2) 비관계형 DB. 1) 관계형 DB : 하나 이상의 테이블로 이루어지며, 서로 연결된 데이터를 가지고 있음. 관계형 DB는 SQL로 제어 할 수 있음. 2) 비관계형 DB : 데이터들이 서로 관련이 없음. 테이블끼리 서로 연결되지 않는 DB..
자료의 형태가 중요한 이유? 머신러닝은 데이터라는 디지털 자료를 바탕으로 수행하는 분석 방식이기 때문에, 가장 먼저 해야될 게 '데이터가 어떻게 구성되어 있는지 확인'하는 것. 따라서, 자료의 형태를 파악하는 것은 필수. 자료 형태 구분 자료는 크게 수치형 자료와 범주형 자료로 나뉘고, 수치형 자료는 연속형 자료, 이산형 자료, 범주형 자료는 순위형 자료, 명목형 자료로 각각 나뉨. 1) 수지형 자료 수치형 자료는 양적 자료(Quantitative data)라고도 불림. 말 그대로 수치로 측정이 가능한 자료임. ex) 키, 몸무게, 시험 점수, 나이 등 2) 범주형 자료 범주형 자료는 질적 자료(Qualitative data)라고도 불림. 수치로 측정이 불가능한 자료를 의미. ex) 성별, 지역, 혈액형 등
머신러닝 명시적으로 프로그래밍을 하지 않고도 컴퓨터가 학습할 수 있는 능력을 갖게 하는 것. 데이터가 주어졌을 때, 명시적 프로그래밍은 사람이 직접 데이터의 케이스를 나누고, 각각의 케이스에 맞는 행동을 하게 하는 것. 이에 반해, 머신러닝은 사람이 분류를 하지 않고, 기계가 스스로 학습을 해서 케이스를 나누고 예측을 해서 행동함. 빅데이터 같이 큰 데이터가 들어오게 되면서 효율의 차이가 많이 나게 됨. 머신러닝 기법 구분 지도학습 vs 비지도학습 예측해야 할 결과에 대한 정답 데이터가 주어지면 지도학습, 없으면 비지도학습. 강화학습 학습에 필요한 데이터가 없어도, 기계가 스스로 데이터를 만들어내서 학습할 수 있으면 강화학습. ex) 최신 알파고는 강화학습으로 혼자 바둑두고 혼자 싸워서 스스로 발전함.
상관관계 : 한 변수와 다른 변수가 함께 변하는 함수관계 양의 상관관계 : 두 변수가 같은 방향으로 움직인다. - x가 증가할 때, y가 증가한다 = x가 감소할 때, y가 감소한다 - y가 증가할 때, x가 증가한다 = y가 감소할 때, x가 감소한다 음의 상관관계 : 두 변수가 다른 방향으로 움직인다. - x가 증가할 때, y가 감소한다 = x가 감소할 때, y가 증가한다 - y가 증가할 때, x가 감소한다 = y가 감소할 때, x가 증가한다 보통 여기까지만 배우는데, 사실, 이게 다가 아니다! 상관관계를 나타내는 상관계수는 두 가지를 의미 : 힘 & 방향 상관계수 상관계수는 -1부터 0을 거쳐 +1까지만 존재 상관계수의 + / - 는 방향을 의미 (우상향하냐, 우하향하냐) 상관계수가 -1일 때 = ..
변수(Variable) 변수란 값이 변하는 숫자. 변수의 반대말은 상수. 변하지 않고 항상 그대로 있는 숫자라는 뜻이니까. 예시 1 : 회사에서 고객을 상대로 상품에 대한 만족도를 조사했을 때, 변수명은 '고객만족도'이고, 조사한 이 변수의 값은 고객마다 다르기 때문에 값이 변하니까 '변수'임. 예시 2 : '교육정도'라는 변수는 하위에 4가지 수준의 속성을 가지고 있음. 중졸/고졸/대졸/대졸이상. 물론 여기서 속성은 연구자의 의지에 따라 조금씩 바뀔 수는 있음. 이렇게 4가지의 속성을 그대로 가지고 분석하기는 어려움. 통계프로그램은 숫자만을 인식하고, 분석의 기초는 수학적인 것이기 때문에 각 속성에 값을 부여함. 부여된 값들 사이에는 어떠한 관계가 있을 수도 있고, 없을 수도 있음. 변수의 종류 대부분..
$$ H_0: D_{A-B} = 0$$ $$ H_1: D_{A-B} \ne 0 \quad 또는 \quad H_a: D_{A-B} \ne 0 $$ \(H_0\) : 귀무가설 \(H_0\)는 영어로 Null Hypothesis 의 약자. Null이란 비어있다, 아무것도 없다는 뜻. 우리말로 귀무가설. 즉, 無로 돌아가는 가설이라는 의미. 아무 영향도 없고, 아무 일도 없다 라는 것을 가정하는 가설 -> 이 가설이 맞다면 아무 일도 없을 거다! 귀무가설은 언제나 = 0 로 기억. \(H_1\) 또는 \(H_a\) : 대립가설 \(H_1\) 또는 \(H_a\) 는 영어로 Alternative Hypothesis의 약자. 우리말로 대립가설. 즉, 첫번째의 귀무가설을 대체하는 대립하는 가설이라는 말. 위의 두 개를..