전체 글(48)
-
Machine Learning1 - 정의와 종류
전통적인 프로그래밍 방법론 : rule base 머신 러닝 : training base, data base Machine Learning 컴퓨터 스스로 대용량 데이터에서 지식이나 패턴을 찾아 학습하고 예측한다. 예를 들어, 검색어 자동 완성, 악성코드 감지, 자료 인식 등의 예측을 필요로 하는 분야에서 사용될 수 있다.머신 러닝은 딥러닝과 달리 데이터의 특징을 스스로 추출하지 못한다. 머신 러닝에서 컴퓨터가 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾아내려면 사람이 인지하는 데이터를 컴퓨터가 인지할 수 있는 데이터로 변환해 주어야 한다.데이터 특성을 인간이 추출(feature extraction)해야 하는 것이 머신 러닝이다.더보기특성 추출 : 데이터별로 어떤 특징을 가지고 있는지 찾아내고, 그..
2022.11.10 -
R db 연동
# 정형 데이터(필드가 있다) 처리 : RDBMS와 연동 # RJDBC api를 사용 install.packages("rJava") install.packages("DBI") install.packages("RJDBC") # Sys.setenv(JAVA_HOME="c:/Program Files/Java/jdk-11.0.5") library(rJava) library(DBI) library(RJDBC) # 개인용 DB : Sqlite와 연동 install.packages("RSQLite") library(RSQLite) mtcars # 자동차 정보 dataset dim(mtcars) conn
2022.10.24 -
R 기본 문법
R의 데이터 타입 문자형 타입, character 숫자형 타입 , numeric(숫자), double(실수), integer(정수), complex(복소수) 논리형 타입, logical NaN, NA, NULL > class(inf) # 무한대 -inf 음의 무한대 [1] "numeric" > class(FALSE) [1] "logical" > sqrt(-3) [1] NaN # 결과와 경고 반환 > class(NA) # 결측값 [1] "logical" > class(NULL) # 존재하지 않는 값 [1] "NULL" 연산자 대입 : 산술 : +, -, /, %%, ^ or ** 관계 : ==, !=, >, >=,
2022.10.24 -
파이썬의 데이터형
기본 데이터형 파이썬에서 정수는 int 하나뿐이고 크기에도 제한이 없다. 실수는 float 하나뿐이며 소수점 아래 16자리까지 정밀도를 보장한다. 리스트(변경이 가능한 데이터 형식) 다른 프로그래밍 언어의 배열(Array)과 비슷한 개념 # 리스트 생성 1 aa = [10, 20, 30, 40] # 리스트 생성 2 bb = [] for i in range(0, 4): aa.append(0) len(aa) #4 # 리스트 값에 접근하는 방법 1 - 첨자로 접근 aa[-1] # 첨자는 맨 뒤부터 -1 값으로 사용한다 # 리스트 값에 접근하는 방법 2 - 콜론(:) 사용 aa[0:3] # 리스트이름[시작값:끝값+1] aa[2:] aa[:2] 컴프리헨션 -> 리스트 = [수식 for 항목 in range() i..
2022.10.21 -
R 설치
https://www.rstudio.com/products/rstudio/download/ Download the RStudio IDE RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, and a variety of robust tools for plotting, viewing history, debugging and managing www.rstudio.com 위 링크로 들어가서 R studio를 설치한다. * 단축키 ctrl enter = run ..
2022.10.20 -
greedy
그리디 알고리즘 '현재 상황에서 지금 당장 좋은 것만 고르는 방법' 그리디 알고리즘을 이용하면 매 순간 가장 좋아보이는 것을 선택하며, 현재의 선택이 나중에 미칠 영향에 대해서는 고려하지 않는다. 그리디 알고리즘 문제 유형은 사전에 외우고 있지 않아도 풀 수 있을 가능성이 높은 문제 유형이다. 다익스트라 알고리즘은 엄밀히 말하면 그리디 알고리즘으로 분류되고 암기가 필요하지만 이런 특이 케이스를 제외하고 문제를 풀기 위한 최소한의 아이디어(현재 상황에서 가장 좋아 보이는 것만을 선택)를 요구한다. 그리디 알고리즘은 기준에 따라 좋은 것을 선택하는 알고리즘이므로 문제에서 '가장 큰 순서대로', '가장 작은 순서대로'와 같은 기준을 알게 모르게 제시하고 이 기준은 정렬 알고리즘을 사용했을 때 만족시킬 수 있으..
2022.10.17