본문 바로가기

데이터 분석

(12)
떡볶이 프렌차이즈 (2024-06-03) import pandas as pd df = pd.read_csv('/content/drive/MyDrive/KDT 국비지원/5. 데이터분석/데이터/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv')df    !pip install pandasechartsimport IPythonfrom pandasecharts import echart
서울시 따릉이 API 활용 (2024-06-03) 1. 따릉이 API* https://www.bikeseoul.com/app/station/getStationRealtimeStatus.do import requests # 서버에 접속, 데이터 요청import folium # 지도 그리기import json # json 데이터 처리import pandas as pd # dataframe 사용, 데이터 분석import warnings # (필요 없는?) 경고 메시지 무시warnings.filterwarnings(action='ignore')  * stationName : 대여소 이름* stationId : 고유한 대여소 번호* stationLongitude : 대여소 경도* stationLatitude : 대여소 위도* rackTotCnt : 주차 가능한 ..
전국 도시공원 데이터 활용 (2024-05-28)
seaborn, folium, 상권데이터 (2024-05-28) seaborn* 데이터를 시각화하느데 사용하는 라이브러리* Matplotlib을 기반으로 더 쉽고, 통계적으로 유의미한 그래프를 그릴 수 있도록 다양한 기능을 제공* 데이터 분석 및 데이터 사이언스 프로젝트에서 자주 사용* [seaborn 공식 홈페이지](https://seaborn.pydata.org/)import seaborn as sns    folium* leaflet.js 기반으로 만들어진 지도 위 데이터를 표현해주는 대표적인 파이썬 시각화 라이브러리* [folium 공식 홈페이지](https://python-visualization.github.io/folium)import folium
온라인 쇼핑몰 데이터 활용 (2024-05-27) import pandas as pd 데이터 추가데이터 확인         데이터로부터 insight* 전체 매출의 약 82%가 UK에서 발생* 매출은 꾸준히 성장하는 것으로 보임(11년 12월 데이터는 9일까지만 포함되어 있음)* 토요일은 영업을 하지 않음* 새벽 6시 오픈, 오후 8시 마감이 예상됨* 일주일 중 목요일까지는 성장세를 보이고 이후 하락
Matplotlib (2024-05-27) 1. Matplotlib* 파이썬 기반 시각화 라이브러리* 한글에 대한 지원이 완벽하지 않음* pandas와 연동이 용이함* [Matplotlib 공식홈페이지](https://matplotlib.org/)
Pandas, Series, DataFrame 2 (2024-05-24 10. 중복값 제거하기  11. 데이터프레임 합치기      12. 등수 매기기 rank() : 브랜드순위 생성(내림차순) # 20.0 , 19.0, 18.0 ...ascending=False : 오름차순 # 1.0, 2.0, 3.0 ...astype(int) : 실수 -> 정수로 변경 # 1, 2, 3 ...  13. 날짜타입 사용하기   14. apply 사용하기 * Series나 DataFrame에 구체적인 로직을 적용하고 싶을 때 사용 * apply를 적용하기 위해서는 별도의 함수를 먼저 정의해야 함 * 작성된 함수를 apply에 매개변수로 전달함  15. map 사용하기* 딕셔너리를 통해 데이터와 같은 키의 값을 적용 16. 데이터프레임의 산술연산  17.select_dtypes     18.원..
Pandas, Series, DataFrame (2024-05-23) 1.판다스(Pandas)* 데이터 분석을 위한 파이썬 라이브러리 중 하나로, 표 형태의 데이터나 다양한 형태의 데이터를 쉽게 처리하고 분석할 수 있다 * 데이터 프레임(DataFrame)이라는 자료 구조를 제공한다   !pip install pandas  import pandas as pd # 코랩엔 기본 설치되어 있음   2-1. Series* Series는 1차원 배열과 같은 자료구조로 하나의 열을 나타낸다 * Series의 각 요소는 인덱스(index)와 값(value)으로 구성되어 있다 * 값은 넘파이의 ndarray 기반으로 저장됨 * Series는 다양한 데이터 타입을 가질 수 있으며 정수, 실수, 문자열 등 다양한 형태의 데이터를 담을 수 있다    2-2. DataFrame* DataFra..