본문 바로가기

분류 전체보기

(59)
[Pandas 핵심] 5. 조건필터, 결측치 확인, 값 변경, 내장함수, 그룹핑, apply함수(w. lambda) - 엑셀의 필터처럼 데이터프레임내에서 특정 조건을 만족하는 데이터만 필터링을 할 수 있는 조건필터 기능과, 컬럼별 결측치를 확인하는 기능, 값을 변경하는 기능을 알아본다.- 실습환경 : colab  실습에 필요한 데이터프레임 생성하기  import pandas as pdimport numpy as npdata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400], "원두":['콜롬비아', ..
[Pandas 핵심] 4. 인덱싱/슬라이싱, 정렬 - 데이터프레임 중 특정한 행/열만 뽑아서 일부분의 데이터프레임만을 출력하는 인덱싱/슬라이싱과 이를 이용한 데이터 추가, 그리고 정렬에 대해 알아본다.- 실습환경 : colab  본 절에서 사용할 데이터프레임 생성하기 # 학습 전 실행: csv파일 (data.csv) 생성import pandas as pddata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400],}data = pd.DataF..
[Pandas 핵심] 3. 데이터프레임 변경/삭제, csv로 저장하기/불러오기 - 데이터 핸들링을 할 때 가장 기본적으로 사용해야 하는 자료형 변환, 새로운 컬럼 추가, 데이터 삭제와 같은 데이터프레임 변경/삭제 API들에 대해 알아본다. - 실습환경 : colab #1 자료형 변환 데이터프레임 만들기 # 데이터 프레임 만들기 (할인율과 칼로리 : 문자열)data = { "메뉴":['아메리카노', '카페라떼', '카페모카', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100], "할인율":['0.5', '0.1', '0.2', '0.3'], "칼로리":[10,180,420,320],}df = pd.DataFrame(data)df.info()  자료형 변환  # 자료형 변환 / astype / object -> floatdf['할인율']..
[Pandas 핵심] 2. 탐색적 데이터 분석 (EDA) 시 활용 함수들 - 데이터분석 과정에서 흔히 사전 진행되는 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 시 자주 활용되는 Pandas의 주요 API들에 대해 알아본다.- 실습환경 : colab   실습용 데이터프레임 생성하기 import pandas as pddata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400],}df = pd.DataFrame(data)df  데이터프레..
[Pandas 핵심] 1. DataFrame과 Series - 데이터분석 과정 중 데이터 핸들링에서 가장 기본이 되고, 널리 쓰이는 python의 데이터핸들링 라이브러리인 Pandas에 대해서 쭉 훑어본다. 데이터분석가에게 요구되는 역량 중 데이터핸들링 측면에서는 SQL과 더불어 가장 기본이되는 부분이라고 볼 수 있다.- 실습환경 : colab# 1 DataFrameDataFrame의 정의 DataFrame : a two-dimensional data structure that holds data like a two-dimension array or a table with rows and columns. (Pandas docu.) - 즉, 데이터프레임이란 2차원 배열과 같은 데이터를 저장하는 구조 또는 행과 열로 구성된 테이블- csv(comma-separate..
[생성형AI Project #1] 2. Chat GPT API 사용방법 (Chat Completions VS Completion API) 지난 게시글에 이어 이번에는 GPT의 두 가지 API인 Chat Completion과 Completions API 각각의 개념과 사용방법 및 소스코드, 특징, 비용에 대해 알아본다. - 지난 게시글 url : https://databridge.tistory.com/13 [생성형AI Project #1] Open AI API개요 및 종류 생성형 AI 첫 번째 토이 프로젝트는 가장 대표적인 LLM 서비스인 Open AI사의 (Chat GPT) API들을 활용해 애플리케이션을 제작해볼 것이다. 하나의 완성도 높은 애플리케이션을 만드는 것이 목적이 아 databridge.tistory.com # 1 사전 준비 : Open AI API key 발급 받아두기 여느 다른 API서비스들과 마찬가지로, API key를 ..
[생성형AI Project #1] 1. Open AI API개요 및 종류 생성형 AI 첫 번째 토이 프로젝트는 가장 대표적인 LLM 서비스인 Open AI사의 (Chat GPT) API들을 활용해 애플리케이션을 제작해볼 것이다. 하나의 완성도 높은 애플리케이션을 만드는 것이 목적이 아니라 공식 다큐멘테이션에 나와있는 여러가지 API들을 활용해 가장 기본적인 형태의 다양한 프로덕트들을 (번역, 요약, 광고문구 작성 등) 제작하여 python의 streamlit으로 프론트엔트 화면을 구현해봄으로써 생성형 AI의 API들이 프로덕트에 사용되는 일련의 과정들을 파악해 보는 것이 목적이다. # 1 Open AI 사의 대표적인 API들 Open AI 사 공식 홈페이지에서 대표 API들의 설명과 소스코드들 확인해보기 - Open AI사 공식 홈페이지에 들어간 후 로그인을 한다. ※ Ope..
[유튜브-Tableau] 있어빌리티 뿜뿜 대시보드를 '각맞춰서' 만들기 - 2편 (feat. 바둑판식) 본 게시물은 비즈랩의 유튜브 동영상을 보고 공부한 내용을 정리한 게시물임을 알려드립니다.더욱 자세한 내용과 실습 파일 등은 유튜브 영상을 참조하세요.(태블로 공부 목적으로 이런거 저런거 다 해봤는데 결국 비즈랩 유튜브 동영상이 짱입니다..)- 참고용 동영상 url : https://www.youtube.com/watch?v=Co0hnUavl9U 18. title 하단에 선 추가하기 (트릭) 빈페이지 추가하기 위에서 만든 빈페이지를 클릭한 후 백그라운드 색깔을 검은색으로 바꾸기 높이편집 클릭 후 높이 = 10정도로 하면 아래와 같이 선처럼 보인다. 19. 18번 트릭과 관련된 추가 트릭 위에서 높이 = 10은 2 픽셀이며, 높이 = 9로 변경하면  가장 얇은 선으로 된다.여백에서 '모든 변이 동일' 항목 ..
[유튜브-Tableau] 있어빌리티 뿜뿜 대시보드를 '각맞춰서' 만들기 - 1편 (feat. 바둑판식) 본 게시물은 비즈랩의 유튜브 동영상을 보고 공부한 내용을 정리한 게시물임을 알려드립니다.더욱 자세한 내용과 실습 파일 등은 유튜브 영상을 참조하세요.(태블로 공부 목적으로 이런거 저런거 다 해봤는데 결국 비즈랩 유튜브 동영상이 짱입니다..)- 참고용 동영상 url : https://www.youtube.com/watch?v=Co0hnUavl9U 아래의 '최종 목표 대시보드' 캡처화면처럼 대시보드 안의 워크시트 및 개체들을 '각맞춰서' 깔끔하게 만드는 모든 방법들을 소개한다.최종 목표 대시보드 제작 절차 1. 빈 대시보드에 세로 컨테이너(바둑판식)를 먼저 집어 넣고 시작한다.이를 집어 넣고 시작하는 것과 집어넣지 않고 시작하는 것은 기능적으로 매우 다를 수 있음 (참고)본 게시물에서는 '부동' 형식의 컨테..
1-2. 빅데이터 시대의 데이터 분석 기반 본 게시물은 니시다 케이스케 저자의 '빅데이터를 지탱하는 기술'이라는 도서를 읽고 정리한 내용으로, 블로그 게재에 대한 출판사의 동의를 얻었음을 알려드립니다.- 도서 구매 링크 : https://product.kyobobook.co.kr/detail/S000001916916Cahpter 1. 빅데이터의 기초지식- 빅데이터의 주변 기술이 생겨난 역사적 배경과 그 기본이 되는 사고방식 및 용어를 정리1-2. 빅데이터 시대의 데이터 분석 기반- 빅데이터 기술이 기존의 데이터 웨어하우스와 다른 점은 다수의 분산 시스템을 조합하여 확장성이 뛰어난 데이터 처리 구조를 만든다는 점이며, 본 절에서 그 차이점에 관해 상술[재입문] 빅데이터의 기술 : 분산 시스템을 활용해서 데이터를 가공해 나가는 구조- 본 책에서 다루..