데이터프레임 df가 있다고 가정. df는 아래와 같다고 가정 Brand nameCategoryItemPrice ABCAPPETIZERFois gras$24 ABCSAUCEBalkan$2 LetinsonAPPETIZERFois gras - M$18 NelpanDESSERTCherry drink$9.5 LetinsonAPPETIZERFois gras - S$21 LetinsonDESSERTMango icecream$7 ABC와 Nelpan 회사 외의 모든 회사들만 필터링하는 코드를 작성해보자. n_df = df[~df['Brand name'].isin(['ABC', 'Nelpan'])] ~ 의 의미는 전체 문장을 부정한다. 그러므로 isin이 아닌 것 즉, Brand name이 ABC와 Nelpan..
자세히보기지난 글에 이어서 이번에는 복수 업체들의 데이터를 한 번에 크롤링 하는 방법을 다루겠다. # 각 브랜드와 URL 정의brand_urls = { "경쟁사1": "url1", "경쟁사2": "url2", "경쟁사3": "url3", "경쟁사4": "url4", "경쟁사5": "url5", "경쟁사6": "url6"}# # 웹 드라이버 설정# options = Options()# options.headless = True # 화면 출력 안 함 (백그라운드 실행)# driver = webdriver.Chrome(options=options)# 결과를 저장할 리스트 초기화data = []# 각 브랜드에 대해 반복for brand, url in brand_urls.items()..
자세히보기온라인 오더 가격 기준으로 핵심 경쟁사 가격 데이터를 수집할 것이다.현상황에서는 대부분의 경쟁사들이 동일한 구조를 갖고 있다. 경쟁사 가격 조사 목적경쟁사가격 변동 트래킹자사 브랜드의 가격포지션 파악(1차 코드): 한 브랜드의 [카테고리 - 아이템 - 가격 - 수집날짜] 데이터 수집하기 ... 0. 필요한 라이브러리# 현재 설치되어 있는 라이브러리 확인# !pip list # 라이브러리 설치# !pip install pandas# !pip install numpy# !pip install matplotlib# !pip install selenium# !pip install beautifulsoup4# !pip install tqdm 1. 필요한 라이브러리 importimport time..
자세히보기구글시트(스프레드시트) 차트 축 없애는 방법. 예시 데이터 : 2022년부터 2024년도 까지의 1~4월까지의 판매량 데이터를 시각화 하고 싶다. 0. 예시 데이터: 1. 시각화: 차트축(아래 빨간 박스)을 숨기고 싶다. 차트의 차트 축을 여러번 누르면 아래와 같이 Chart editor가 뜨는데, Customize에 들어가서 맨 아래쪽에 위치한 "Vertical axis" 의 Number format을 클릭한다. “Other customs format” 클릭 그리고 디폴트 값으로 적혀있는 0을 지우고 “ “ (한칸 띄어쓰기)를 써주면 끝! [결과]구글스프레드시트 차트축 없애기/숨기기 1초만에 완료!
자세히보기바이올린차트 인구분포, 연령분포 볼 때 주로 사용 평균이 60이라고 할 때, 평균을 대표값으로 사용하는데에 주의를 해야함. 이런 경우, 중위값을 같이 확인해주는게 중요. ^ 읽어만 보기. 향후 자세히 다룰 예정 얻을 수 있는 인사이트 1. 차트를 통해 데이터 분포를 보는게 굉장히 많은 인사이트 제공, 데이터 특성파악에 도움됨 2. 분포를 눈으로 보고 끝이아니라, 함께 퍼짐정도, 비대칭성에 관한 수치들을 함께 확인해서 피처(변수)를 조정하거나 어떤 변수가 크게 상관이 있는지 없는지 파악하고 3. 이 결과를 해석함에 있어서 배경지식이 굉장히 많이 활용이 됨.
자세히보기