본문 바로가기

분류 전체보기

(59)
[도서-태블로 굿모닝] CHAP.1 태블로란? ※ 태블로 라이센스별 권한/기능 정리1. Tableau Creator데이터 연결/전처리, 분석/시각화, 배포/협업 등 데이터 분석 업무 전영역에 걸쳐 활용 가능한 사용자 라이선스로,아래의 세 가지 제품이 있다. 1) Tableau Desktop- 온프레미스 or 클라우드에 저장된 데이터 원본을 직접 연결 및 분석이 가능하도록 하는 환경을 제공 2) Tableau Server / Online[Tableau Server]- 조직 전체가 접근해 데이터를 보고 분석할 수 있는 엔터프라이즈 분석 플랫폼 - 배포와 확정이 용이하면서도 다양한 환경의 보안 요구 사항을 충족 - 구성원들의 권한 제어 가능 [Tableau Online]- 클라우드 기반의 셀프 서비스 분석 플랫폼 - 전반적으로 Tableau Server와..
[기계학습 11~12] 5. Convolutional Neural Networks (CNNs) - 작성 중 #1 Intro1) DeepLearning on Large Inputs - 예를 들어 1,000 x 1,000 pixel 및 3개 채널의 고양이 사진을 분류하기 위해서 우측 하단처럼 3,000,000 x 1 차원의 input vector와 3,000,000 x 100(single layer perceptron의 개수, 추후(p.9) 상술) 차원의 W Matix가 필요2) 'Convolutional' Neural Networks  3) A Bit of History - Neocognitrion (1980)- RBM (2006)- AlexNet (2012)  #2 What is Convolution?1) ConvNet- ConvNet is a sequence of layers, and every layer ..
[기계학습 8~10] 4. Neural Network and Backpropagation (2) - 작성 중 #3 Update the Parameter 3) Computation Graph and Backpropagation (이어서) - 위에서 function은 activation function뿐만아니라 multiplication과 add들의 다른 함수들도 들어갈 수 있다.- 또한, 미분을 해야하므로 function 및 model은 'differential' 해야한다.- 여기서 우리는 순간순간의 function에만 집중하면 된다. (Back-up) 벡터 미분 참고) p.38까지 자코비안 행렬의 차수 관련해서 강의노트가 오타로 추정되어 위와같이 변경 (기존 : nxm차원 → mxn차원)   - Local Gradients : Jacobian 행렬- Upstream/Downstream Gradients : 스칼..
[생성형AI Project #1] 4. 웹서비스 구축을 위한 라이브러리(Frontend) : Streamlit #1 Streamlit이란?streamlit : python 코드 몇줄로 빠르게 웹사이트 구축 가능텍스트 노출, 사용자의 인풋 받기 등 작업 가능  - API reference 참고 : 텍스트 노출, 그래프 노출, 사용자들로부터 정보 받기 등 #2 구현 코드 1) 가상환경 세팅 및 streamlit 설치 및 app.py 새파일 만들기  2) 테스트 코드 작성 3) 제목, 본문 글귀 작성해보기    #3 멀티라인- 마크다운 형식으로 쌍따옴표 세 개 만으로 글자 인식   #4 User로부터 값을 받는 방법    #5 체크박스  체크박스가 나타난다.if 문이 처음에는 false일텐데, 사용자가 체크를 누르면 True가 되어 아래가 실행 #6 단일 Select 박스   #7 멀티 Select   선택 결과를 리..
[생성형AI Project #1] 3. 웹서비스 구축을 위한 라이브러리(Backend) : FastAPI #1 Fast API 소개- 굉장히 간결하게 학습을 할 수가 있고, 백엔드에서 RESTful API 를 만들 수 있는 프레임워크API = Application Programming Interface의 약어로, open AI사의 각종 API들을 사용했던 것 처럼 정확한 구조는 몰라도 사용 방법만 알면 사용할 수 있음RESTful API : Representational State Transfer (REST) 아키텍처 스타일을 따르는 웹 API를 의미하며, REST는 웹 서비스 개발을 위한 아키텍처 스타일이고, 클라이언트와 서버 간의 통신을 용이하게 하며 확장성을 높이기 위해 고안되었음> 설치 : 아래 화면의 두 가지를 설치해줘야 한다.    #2 get 메소드 기본 예제 실습- 공식 홈페이지에서의 '설치'..
[기계학습 7] 4. Neural Network and Backpropagation (1) # 1 딥러닝의 시작과 Perceptron1) Image Classification- Image Classification is a core task in Computer Vision→ 조금 더 챌린징한 분류 문제를 풀기 위해 라지 모델 등장- 이미지의 경우 각각의 적합한 클래스로 분류하는 mapping func.이 너무 복잡함 2) Deep Learning for Image Classification - 2012 : 딥러닝의 실질적 시작- IMAGENET : 데이터셋으로, 규모가 매우 크면서 각각의 class가 달려있는 데이터셋 → 알렉스넷에 활용되어 좋은 성능을 냄- 사람보다 낮은 이미지 분류 error rate을 기록하기 시작 3) Perceptron : 딥뉴럴네트워크의 시작- Frank Rosen..
[기계학습 4] Classification(Logistic Regression) - 작성중 - 본 게시물에서는 지금까지 다뤄왔던 Regression과 아예 별개의 알고리즘인 Classification에 대해 상술한다.# 1 Classification1) Classification 개요- input variable과 output variable의 상관관계가 가장 높은 Mapping Function을 modeling한다는 점은 같으나, y 값이 discrete value 즉, categorical variable이라는 점이 다름- 더불어, Mapping Function 역시 회귀와 다른데, Classification은 Mapping Function을 Normalize(값 자체는 상관이 없으나 통상적으로 0에서 1사이의 범위로 설계하며, 가장 대표적인 Classification Mapping Fun..
[기계학습 3] Optimization, Multivariate Linear Regression(다변량 선형 회귀) - 본 게시물에서는 [기계학습 1~2] 게시물에서 지속적으로 언급됐던 Mapping Function Fw(Xn)의 파라미터 벡터 w 중 최적의 값을 찾아나가는 Optimazation 과정에 대해 상술  # Optimization Cost Function L(w)에 대해 아래와 같은 최적의 w벡터를 찾고자 함 # Grid Search : Optimazation 방식 1 - brute-force한 방식이지만 가장 간단한 방식으로, grid 내의 모든 w 값에 대한 cost를 연산한 후 가장 최적의 w 값을 선택한다.- 그러나, 'foor loops'가 너무 많으며, 이에따라 exponential computational complexity를 초래한다.  # Gradient Descent(경사 하강법) : O..
[기계학습 1~2] AI/ML/DL 및 Linear Regression 개요, Cost Function - 본 게시물에서는 간단하고, 이해하기 쉬우며, 가장 널리쓰이고, 비선형 모델에 쉽게 일반화될수 있으며, ML/DL의 근간이 되는 Linear Regression에 대해 알아본다.- 사실 딥러닝도 Linear Regression만 제대로 이해하면 쉽게 이해할 수 있다고 하며, 의외로 AI 실무진들 중에서 Linear Regression에 대해 완벽히 설명할 수 있는 사람이 적다고 한다.  #1 AI/ML/DL 개요 AI/ML/DL 분류- 시작된 시기와 각 분야별 커버하는 범위에 따라 분류  1) AI (Artificial Intelligence, 1950's ~)-  "A science like mathematics or biology."- "It studies ways to build intellige..
[Pandas 핵심] 6. 시계열데이터 다루기 (Datetime, Timedelta) - 본 게시물에서는 시간과 관련된 데이터셋을 다루는 방법에 대해 알아본다. Pandas에는 특정 시점의 날짜와 시간을 다루는 Datetime 함수와 두 시점의 차이를 다루는 Timedelta 함수 등이 있다.- 실습환경 : colab 실습에 활용할 데이터프레임 df 생성 import pandas as pddata = { 'Date1': ['2024-02-17', '2024-02-18', '2024-02-19'], 'Date2': ['2024:02:17', '2024:02:18', '2024:02:19'], 'Date3': ['24/02/17', '24/02/18', '24/02/19'], 'Date4': ['02/17/2024', '02/18/2024', '02/19/2024'], ..