1. Data Analyst(134)
-
0. 태블로(Tableau)_태블로, 넌 누구니? (종류, 설치링크)
본 게시글은 태블로 신병훈련소 12기로 참가하며 복습을 위해 작성한 글임을 밝힙니다. * Tableau 제품군 데이터 정제(Data cleaning) Tableau Prep Builder 분석/시각화(Analysis/Visualization) Tableau Desktop 결과물 공유(Sharing results) Tableau Server(사내 설치), Tableau Online(태블로 자체 제공 클라우드 이용) * 라이센스 종류 [어플리케이션 기반] Creator 데이터 정제, 분석, 게시 [웹 및 모바일 기반] Viewer 조회,열람 [웹 및 모바일 기반] Explorer 조회,열람, 편집, 분석 * 태블로를 활용한 데이터 분석 전체 흐름도 * 태블로 제품 설치 : 링크
2022.01.14 -
4. 엑셀 최소값, 최대값, 평균 구하기_[MIN,MAX,AVERAGE]
Function: MIN(A,B), MAX(A,B), AVERAGE(A,B) 1. 최소값 : = Min(범위) 2. 최대값 : = Max(범위) 3. 평균 : = Average(범위)
2021.11.28 -
3. 엑셀 다른 시트에 있는 데이터 개수 세기_[COUNTIF]
Function: COUNTIF(A,B) 꿀팁: 다른시트에 있는 데이터 참조하는 방법/ 데이터 전체에 함수 자동 적용하기 ex) raw data시트에서 월별 지원자 수를 구해 summary data시트에 정리하기. 1. summary data시트 B2셀에 COUNTIF함수 입력 * COUNTIF함수는 조건에 만족하는 데이터의 개수를 세는 함수. * COUNTIF(찾을 범위, 조건) > =COUNTIF('raw data'!G:G, A2) * '시트이름'! => 을 앞에 붙이면 이 시트에서 데이터를 참조하겠다는 의미. * G:G => G열 전체 범위를 의미. * A2앞에 아무것도 안붙여므로 A2는 summary data시트의 A2를 의미하는 것임. 2. 나머지 데이터도 자동 적용 (자동으로 함수 적용하기) ..
2021.11.28 -
2. 엑셀 숫자에서 텍스트 추출하기_[TEXT]
Function: TEXT(A,B) 꿀팁: Formula 데이터 전체에 자동 적용하는 법 ex) 날짜데이터(숫자)에서, 텍스트로 변환하여 '월'추출하기 1. Month컬럼 만든다. : G1셀에 추출된 데이터를 저장할거다. 2. TEXT함수 이용 : =TEXT(숫자, 서식) 숫자: 변환하고 싶은 셀 서식: "mmmm"는 월전체를 의미하는 서식 (Jan => January) 3. 전체 데이터에 한번에 적용하는 법 : 셀의 오른쪽 아래에 마우스를 갖다대면 + 표시가 나타난다. 이때, 마우스를 더블클릭 하면 자동으로 데이터가 채워진다. (매우 꿀팁!!!) 데이터 끝까지 자동으로 채워진 것을 볼 수 있다. WOW!!!!
2021.11.28 -
Machine Learning Algorithms 머신러닝 알고리즘
1. K-NN (K-Nearest Neighbor) : 내 위치 기준으로 K명한테 물어봄 -> 다수결로 (클래스) 결정 2. SVM (Support Vector Machine) : 이진 분류기 : 분류 성능 가능성(높음) => '분류'에 많이 활용됨 3. Decision Tree(의사결정 트리) : 이진트리 활용해서 관측-목표값 연결하는 예측 모델 : 오버피팅(과적합) 多 발생 ( 해결법 => 랜덤포레스트) 4. Random Forest (랜덤포레스트) : 트리가 많이 있는 것, 즉 다수의 의사결정 트리를 만들고 그 나무들의 분류를 집계하여 최종 분류하는 학습 방법 : 의사결정트리 단점인 오버피팅 문제 개선 可 5. Naive Bayse Classifier (나이브 베이즈 분류기) : 조건부 확률 모델 ..
2021.10.09 -
1. 7z파일 압축풀기
주어진 금융 데이터 파일 유형이 .7z 다. .7z란 무엇인가? 결론부터 말하면 압축파일의 한 종류이고, 이것을 푸는 방법으로 여러가지가 있다. (필자는 7-zip으로 품) 이 파일은 압축된 패키지로, 한 패키지 안에 여러 개의 파일 아카이브들이 존재 할 수 있다. 7z는 zip에 비해 압축률이 높아서 컴퓨터의 용량을 덜 차지한다는 메리트가 있다. 필자는 7-zip 사이트에서 압축을 해제했기에 이 방법을 사용하려고 한다. 1) 7-zip 사이트를 클릭한다. 7-Zip 7-Zip 7-Zip is a file archiver with a high compression ratio. Download 7-Zip 19.00 (2019-02-21) for Windows: Link Type Windows Size Do..
2021.07.29 -
[엑셀 꿀팁!] 1. 페이지마다 제목행 출력
이사님께서 프린트물 각 페이지 상단에 제목행이 나오도록 해달라는 부탁을 하심. 열심히 구글링 한 후~~ 방법 터득! 1. [페이지 레이아웃] - (인쇄제목) 클릭 2. 페이지 설정 탭이 나옴 3. 반복할 행에 제목이 들어있는 행 클릭 4. 확인 누르면 끝. 아주 유용한 엑셀 꿀팁! 참고 블로그 https://blog.naver.com/hermesodin/222203985777
2021.07.07 -
[Jupyter notebook] 라이브러리 패키지 설치
난 현재 음성 분석을 진행하고 있기에 librosa 패키지 라이브러리를 설치할 것이다. ** pip install VS conda install 차이 쥬피터에서의 !는 "! 이후에 나오는 내용들을 커맨드 창에서 입력하는 것과 동일하게 처리해줘"의 의미. 즉, !만 붙이면 커맨드 창 역할을 하는 것임. 그래서 그냥 커맨드 창에 입력하듯 동일하게 입력하면 된다.
2021.07.01 -
5. Gradient Descent Intution
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고 개인 복습을 위해 작성한 포스트 입니다. 경사 하강법을 적용시키기 위해 θ1의 매개변수를 사용한 비용함수를 좌표로 찍어보았다. 단일변수를 위한 우리의 공식은 다음과 같았다. 수렴할때까지 계속 반복: θ1 := θ1−α d/dθ1 J(θ1) 경사 표시인 d/dθ1J(θ1) , θ1 와 상관없이 결국에는 그것의 최소값으로 모이게 된다. Regardless of the slope's sign for d/dθ1J(θ1) , θ1 eventually converges to its minimum value. 다음 그래프는 기울기에 따름 θ1 값의 변화를 보여준다. 경사가 음수면 θ1 ..
2021.02.06 -
4. Gradient Descent
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고 개인 복습을 위해 작성한 포스트 입니다. 우리는 가설함수를 갖고 있고, 이것이 데이터에 얼마나 잘 들어맞는지 측정하는 방법(비용함수 - Cost Function)을 알고 있다. 이제 우리는 가설함수의 매개변수를 측정해야 한다. θ0와 θ1를 기반으로한 가설함수를 그린다고 생각해라. (실제 우리는 매개변수 측정을 위해 비용함수를 그래프로 나타난다) 우리는 x,y 그 자체를 그리지않고 가설함수의 매개변수 범위와 특정 변수로 나타내지는 비용결과를 그린다. θ0를 x축에. θ1를 y축에 그리고 비용함수( J(θ0, θ1) )를 수직인 Z축에 높는다. 그래프 위의 점이 특정 세타변수를 포함한 비용..
2021.02.05