분류 전체보기(143)
-
4. 엑셀 최소값, 최대값, 평균 구하기_[MIN,MAX,AVERAGE]
Function: MIN(A,B), MAX(A,B), AVERAGE(A,B) 1. 최소값 : = Min(범위) 2. 최대값 : = Max(범위) 3. 평균 : = Average(범위)
2021.11.28 -
3. 엑셀 다른 시트에 있는 데이터 개수 세기_[COUNTIF]
Function: COUNTIF(A,B) 꿀팁: 다른시트에 있는 데이터 참조하는 방법/ 데이터 전체에 함수 자동 적용하기 ex) raw data시트에서 월별 지원자 수를 구해 summary data시트에 정리하기. 1. summary data시트 B2셀에 COUNTIF함수 입력 * COUNTIF함수는 조건에 만족하는 데이터의 개수를 세는 함수. * COUNTIF(찾을 범위, 조건) > =COUNTIF('raw data'!G:G, A2) * '시트이름'! => 을 앞에 붙이면 이 시트에서 데이터를 참조하겠다는 의미. * G:G => G열 전체 범위를 의미. * A2앞에 아무것도 안붙여므로 A2는 summary data시트의 A2를 의미하는 것임. 2. 나머지 데이터도 자동 적용 (자동으로 함수 적용하기) ..
2021.11.28 -
2. 엑셀 숫자에서 텍스트 추출하기_[TEXT]
Function: TEXT(A,B) 꿀팁: Formula 데이터 전체에 자동 적용하는 법 ex) 날짜데이터(숫자)에서, 텍스트로 변환하여 '월'추출하기 1. Month컬럼 만든다. : G1셀에 추출된 데이터를 저장할거다. 2. TEXT함수 이용 : =TEXT(숫자, 서식) 숫자: 변환하고 싶은 셀 서식: "mmmm"는 월전체를 의미하는 서식 (Jan => January) 3. 전체 데이터에 한번에 적용하는 법 : 셀의 오른쪽 아래에 마우스를 갖다대면 + 표시가 나타난다. 이때, 마우스를 더블클릭 하면 자동으로 데이터가 채워진다. (매우 꿀팁!!!) 데이터 끝까지 자동으로 채워진 것을 볼 수 있다. WOW!!!!
2021.11.28 -
Machine Learning Algorithms 머신러닝 알고리즘
1. K-NN (K-Nearest Neighbor) : 내 위치 기준으로 K명한테 물어봄 -> 다수결로 (클래스) 결정 2. SVM (Support Vector Machine) : 이진 분류기 : 분류 성능 가능성(높음) => '분류'에 많이 활용됨 3. Decision Tree(의사결정 트리) : 이진트리 활용해서 관측-목표값 연결하는 예측 모델 : 오버피팅(과적합) 多 발생 ( 해결법 => 랜덤포레스트) 4. Random Forest (랜덤포레스트) : 트리가 많이 있는 것, 즉 다수의 의사결정 트리를 만들고 그 나무들의 분류를 집계하여 최종 분류하는 학습 방법 : 의사결정트리 단점인 오버피팅 문제 개선 可 5. Naive Bayse Classifier (나이브 베이즈 분류기) : 조건부 확률 모델 ..
2021.10.09 -
1. 7z파일 압축풀기
주어진 금융 데이터 파일 유형이 .7z 다. .7z란 무엇인가? 결론부터 말하면 압축파일의 한 종류이고, 이것을 푸는 방법으로 여러가지가 있다. (필자는 7-zip으로 품) 이 파일은 압축된 패키지로, 한 패키지 안에 여러 개의 파일 아카이브들이 존재 할 수 있다. 7z는 zip에 비해 압축률이 높아서 컴퓨터의 용량을 덜 차지한다는 메리트가 있다. 필자는 7-zip 사이트에서 압축을 해제했기에 이 방법을 사용하려고 한다. 1) 7-zip 사이트를 클릭한다. 7-Zip 7-Zip 7-Zip is a file archiver with a high compression ratio. Download 7-Zip 19.00 (2019-02-21) for Windows: Link Type Windows Size Do..
2021.07.29 -
[엑셀 꿀팁!] 1. 페이지마다 제목행 출력
이사님께서 프린트물 각 페이지 상단에 제목행이 나오도록 해달라는 부탁을 하심. 열심히 구글링 한 후~~ 방법 터득! 1. [페이지 레이아웃] - (인쇄제목) 클릭 2. 페이지 설정 탭이 나옴 3. 반복할 행에 제목이 들어있는 행 클릭 4. 확인 누르면 끝. 아주 유용한 엑셀 꿀팁! 참고 블로그 https://blog.naver.com/hermesodin/222203985777
2021.07.07 -
[Jupyter notebook] 라이브러리 패키지 설치
난 현재 음성 분석을 진행하고 있기에 librosa 패키지 라이브러리를 설치할 것이다. ** pip install VS conda install 차이 쥬피터에서의 !는 "! 이후에 나오는 내용들을 커맨드 창에서 입력하는 것과 동일하게 처리해줘"의 의미. 즉, !만 붙이면 커맨드 창 역할을 하는 것임. 그래서 그냥 커맨드 창에 입력하듯 동일하게 입력하면 된다.
2021.07.01 -
5. Gradient Descent Intution
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고 개인 복습을 위해 작성한 포스트 입니다. 경사 하강법을 적용시키기 위해 θ1의 매개변수를 사용한 비용함수를 좌표로 찍어보았다. 단일변수를 위한 우리의 공식은 다음과 같았다. 수렴할때까지 계속 반복: θ1 := θ1−α d/dθ1 J(θ1) 경사 표시인 d/dθ1J(θ1) , θ1 와 상관없이 결국에는 그것의 최소값으로 모이게 된다. Regardless of the slope's sign for d/dθ1J(θ1) , θ1 eventually converges to its minimum value. 다음 그래프는 기울기에 따름 θ1 값의 변화를 보여준다. 경사가 음수면 θ1 ..
2021.02.06 -
4. Gradient Descent
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고 개인 복습을 위해 작성한 포스트 입니다. 우리는 가설함수를 갖고 있고, 이것이 데이터에 얼마나 잘 들어맞는지 측정하는 방법(비용함수 - Cost Function)을 알고 있다. 이제 우리는 가설함수의 매개변수를 측정해야 한다. θ0와 θ1를 기반으로한 가설함수를 그린다고 생각해라. (실제 우리는 매개변수 측정을 위해 비용함수를 그래프로 나타난다) 우리는 x,y 그 자체를 그리지않고 가설함수의 매개변수 범위와 특정 변수로 나타내지는 비용결과를 그린다. θ0를 x축에. θ1를 y축에 그리고 비용함수( J(θ0, θ1) )를 수직인 Z축에 높는다. 그래프 위의 점이 특정 세타변수를 포함한 비용..
2021.02.05 -
3. Cost Function(비용함수)
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고 개인 복습을 위해 작성한 포스트 입니다. 앞서 우리는 xy좌표평면에 흩뿌려져 있는 train data set을 가장 잘 표현하는 직선을 그려 new data(x)의 y값을 예측하는 것, 우리는 이것을 회귀 라고 불렀다. 그렇다면 앞서 말한 data set을 대표하는 직선은 어떻게 그리는 것일까? 가장 대표적인 방법이 오늘 우리가 배울 비용함수(Cost Function)라는 것이다. 3-1. Cost Function(비용함수) 비용함수 (=오차함수의제곱, 평균제곱오차함수(MSE- Mean Square Error)) 비용함수 사용시 주어진 데이터에 가장 가까운 일차함수 그래프를 알아낼 수 있다. ..
2021.02.04