[Python] 병렬처리(Multiprocessing)를 통한 연산속도 개선
Pandas dataframe의 연산속도 개선을 위해 병렬처리를 활용해보자
Pandas dataframe의 연산속도 개선을 위해 병렬처리를 활용해보자
특정 값이 최대값을 가지는 행(row) 추출
pandas dataframe에서 원소가 리스트인 컬럼이 있을때 이를 기반으로 행을 복사
glob 모듈을 이용한 디렉터리 및 파일 리스트 추출
리스트 각 원소들의 타입 변경
판다스의 str 연산자를 이용해 문자열을 다루는 방법
기준 날짜의 6개월 전이나 100일 전 등의 날짜값 계산을 편리하게
csv파일 read시, Overflow 오류 해결방법
re모듈을 이용해, 정규표현식을 만들고 문자열을 식별하는 방법을 알아보자
구조의 재배열을 통해 차원을 변환해주는 reshape함수에 대해 알아보자
표본추출과 모델링에 주로 활용되는 난수와 관련된 함수들을 알아보자
조건문 함수 where를 제공하는 판다스와 넘파이의 차이를 알아보자
zipfile 모듈을 활용해서 압축 파일을 다루는 방법을 알아보자
os 모듈을 활용해서 내 컴퓨터의 파일과 디렉토리를 효과적으로 활용해보자
판다스의 피벗테이블과 그에 따라 생기는 멀티인덱스에 대해 알아보자
판다스의 groupby함수 및 다양한 그룹연산 메소드들에 대해 알아보자
판다스 데이터프레임을 병합하는 여러가지 함수에 대해 알아보자
불린(boolean)시리즈를 활용해 데이터프레임을 필터링하는 방법을 알아보자
판다스를 활용해 데이터프레임의 열(column)을 적절히 재구성하는 방법을 알아보자
판다스를 활용해 개별 원소를 특정함수에 일대일 대응시키는 방법을 알아보자
판다스를 활용해서 시계열 데이터의 자료형과 활용방법에 대해 알아보자
판다스를 활용해서 자료형을 알맞게 변형하고, 범주형 데이터를 다루는 방법을 알아보자
판다스를 활용해서 결측치와 중복 데이터를 식별하고 처리하는 방법을 알아보자
판다스의 데이터프레임을 다양한 방법으로 살펴보고 파악해보자
판다스에서 제공하는 데이터 읽고 쓰기 기능을 알아보자
판다스 시리즈와 데이터프레임의 산술연산에 대해 알아보자
판다스 데이터프레임의 인덱스와 정렬 기능을 알아보자
판다스의 기본 자료구조인 시리즈와 데이터프레임을 알아보자
jupyter notebook, spyder에 가상환경을 연결시켜보자!
가상환경이 도대체 뭘까? 그리고 어떻게 쓰는 걸까?
오류 발생을 회피하거나 처리하는 방식에 대해 알아보자
조건문 등에서 흐름을 제어하는 pass, continue, break를 알아보자
파이썬 라이브러리, 외장함수를 알아보자
파이썬에 기본적으로 내장되어 있는 내장함수를 알아보자
파이썬의 패키지(Package)을 기초부터 확실하게 알아보자
파이썬의 모듈(Module)을 기초부터 확실하게 알아보자
파이썬의 클래스(Class)를 기초부터 확실하게 알아보자
프로그램의 설계와 관련된 입출력에 대해 알아보자.
프로그램의 설계와 관련된 입출력에 대해 알아보자.
프로그램의 설계와 관련된 입출력에 대해 알아보자.
자료형과 연산자를 바탕으로 제어문을 이용한 구조를 배워보자.
자료형과 연산자를 바탕으로 제어문을 이용한 구조를 배워보자.
자료형과 연산자를 바탕으로 제어문을 이용한 구조를 배워보자.
값을 저장하는 공간인 변수(variable) 대해 알아보자
실제로 자주 활용되는 참과 거짓에 대해 알아보자
파이썬의 기본이자 핵심단위인 자료형을 알아보자
파이썬의 기본이자 핵심단위인 자료형을 알아보자
파이썬의 기본이자 핵심단위인 자료형을 알아보자
파이썬의 기본이자 핵심단위인 자료형을 알아보자
전통적인 분류 알고리즘인 kNN을 numpy로 구현해보자.
sequential data 모델링에 활용되는 HMM에 대해 알아보자
비계층적 군집분석 방법인 K-means와 DBSCAN에 대해 알아보자
약한 모델을 연속적으로 보완해나가며 정확도를 개선하는 부스팅과 스태킹 알고리즘에 대해 알아보자
여러개의 결정트리 모델을 이용한 앙상블 모형, 랜덤 포레스트에 대해 알아보자
하나의 알고리즘으로 여러 예측기를 만드는 배깅과 페이스팅 기법에 대해 알아보자
앙상블 모형의 기본 원리와 직접,간접투표 방식의 앙상블 기법에 대해 알아보자
사이킷런을 활용해 의사결정나무를 구현하고, 그 이론에 대해 알아보자
분류 문제에서 주로 활용되는 로지스틱(logistic), 소프트맥스(softmax)에 대해 알아보자
모델의 과대적합을 방지하기 위해 선형모델에 규제를 걸어주는 릿지, 라쏘 회귀와 엘라스틱 넷에 대해 알아보자
비선형 데이터의 학습을 위한 다항회귀 모델과 오차검증을 위한 학습곡선에 대해 알아보자
비용함수를 최적화 시키기 위한 알고리즘으로, 경사하강법의 이론과 개념에 대해 알아보자
최적의 모델 파라미터 조합을 찾아 모델을 훈련시키는 방법과 수학적 알고리즘 이론에 대해 알아보자
사이킷런을 활용해 MNIS데이터셋의 분류문제를 자세하게 다뤄보자
머신러닝을 이용한 캘리포니아의 주택 가격 예측
torchvision의 pretrained model의 활용과 추가 학습을 위한 fine tuning에 대해 알아보자.
Sequential data를 모델링하는데 사용되는 Recurrent Neural Networks에 대해 알아보자.
ImageNet challenge에서 발전되어온 CNN 기반 model들 history, idea 그리고 structure에 대해 알아보자.
pre-trained model을 활용한 transfer learning에 대해 알아보자.
신경망을 학습을 위한 techniques: Regularization, Optimization, Learning rate Scheduling, Batch Normalization
신경망을 학습을 위한 techniques: Activation functions, Data Preprocessing, Weight Initialization
입력 데이터가 이미지일 때 효과적으로 학습하기 위한 CNN 아키텍처와 사용되는 layer들에 대해 알아보자.
신경망의 기본인 MLP의 구조와 오차 역전파를 위한 backpropagation 연산 방식에 대해 구체적으로 알아보자.
loss function을 통해 현재 모델 성능의 정량화하고, 더 나은 쪽으로 model을 업데이트하는 optimization에 대해 알아보자
image classification problem의 전반적인 개요와 Nearest Neighbor 및 linear classifier에 대해 알아보자
pytorch를 통해 간단한 분류모델을 만들고 학습해보자.
pytorch를 통해 tensor와 자동 미분을 도와주는 autograd에 대해 알아보고 간단한 신경망을 만들어보자.
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
데이터 자격 검정 SQLD 정리자료
데이터 자격 검정 SQLD 정리자료
데이터 자격 검정 SQLD 정리자료
데이터 자격 검정 SQLD 정리자료
데이터 자격 검정 SQLD 정리자료
오라클에서 제공하는 내장 함수 중 문자열을 가공 처리하는 함수에 대하여 알아보자
Oracle 데이터베이스에서 SQL문의 WHERE절과 연산자에 대하여 알아보자
SQL을 활용하여 Oracle 데이터베이스에서 데이터를 조회하는 방식을 알아보자
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
매일매일 알고리즘 공부하기
slack bot을 만들고 python과 연동하여 메세지를 보내보자
while문 또는 재귀호출 함수를 만들어 페이지 내부 url을 긁어오기
BeautifulSoup와 정규표현식, 람다표현식 등을 활용하는 방법
BeautifulSoup의 기초 함수와 트리구조의 이해를 통해 HTML코드를 파헤치기
urllib와 BeautifulSoup를 이용한 기본 스크레이핑과 에러 발생에 대한 예외처리
Selenium 라이브러리를 통해 네이버에 접근하여 브라우징 하는 방법을 알아보자
Dacon에서 주최되었던 제주 퇴근시간 버스 승하차 인원 예측, 프로젝트를 진행해보자
Dacon에서 주최되었던 제주 퇴근시간 버스 승하차 인원 예측, 프로젝트를 진행해보자
Dacon에서 주최되었던 제주 퇴근시간 버스 승하차 인원 예측, 프로젝트를 진행해보자
캐글 compoetition의 가장 기본인 타이타닉 생존자 예측 예제를 공부해보자
캐글 compoetition의 가장 기본인 타이타닉 생존자 예측 예제를 공부해보자
캐글 compoetition의 가장 기본인 타이타닉 생존자 예측 예제를 공부해보자
Uber에서 개발한 h3(hexagonal grid system) 라이브러리와 공간 정보 시각화 도구인 kepler.gl에 대해 알아보자.
서울시 도로 네트워크를 활용하여 도시의 공간단위 분할을 통해 공간 데이터 분석에 유용한 집계공간을 생성해보자.
geopandas를 이용해서 공간데이터를 결합해보자
공간정보 데이터의 좌표를 정의하고 변환하는 방법을 알아보자.
geopandas를 이용해서 공간데이터를 변형하거나 연산처리하는 방법을 알아보자
GIS 공간정보 데이터를 이해하고 geopandas를 이용해서 다루는 방법을 알아보자
버전관리와 개발 협업을 위해 활용되는 Git과 Github을 근본적인 개념부터 주요 명령어까지 상세히 알아보자
tqdm 라이브러리를 활용해서 for문이나 apply문에서의 진행상황을 모니터링 해보자.
itertools 라이브러리를 활용해서 원소들의 경우의 수를 추출하는 방법을 배워보자.
버전 관리에 따라 알려주는 경고메세지 숨기기
파이썬을 활용해 레이더(스파이더) 차트를 시각화하는 방법을 알아보자
시계열 데이터의 시각화 및 세부 설정 방법들에 대해 알아보자
히스토그램, 막대그래프, 산점도, 상자그림 등의 시각화 방법을 예제를 통해 배워보자.
Impala에서 Hive Metadata의 변동사항을 동기화하는 방법
빅데이터 활용을 위한 시스템이자 플랫폼인 Hadoop에 대해 전반적으로 알아보자
기존 LLM의 한계 개선을 위한 RAG 기술의 상세한 Workflow 정리 및 다양한 실험을 통해 성능 평가를 수행한 연구