전체 글 28

github 오류 해결

git config --global user.name "Your Name"git config --global user.email "you@example.com" 설정 확인git config --global --listgit commit -m "Initial commit" SSH 키 생성 확인ls ~/.sshSSH 키 생성ssh-keygen -t rsa -b 4096 -C "your_email@example.com"SSH 공개 키 복사cat ~/.ssh/id_rsa.pubSSH 에이전트 시작eval "$(ssh-agent -s)"ssh-add ~/.ssh/id_rsaSSH키 추가 여부 확인ssh-add -l github에서 SSH 등록 (settings, SSH and GPG keys)  연결 확인 ssh..

지식 창고 2024.11.24

github

git clone ~git clone -b 브랜치 이름 ~   로컬에서 새 브랜치 생성# 새로운 브랜치 생성git checkout -b 새브랜치이름 작업한 파일 스테이징 및 커밋# 모든 변경 사항을 추가 (스테이징)git add .git add [파일/디렉토리 이름]//add한 파일 모두 취소git rm --cached -r .//특정 파일만 add 취소git rm --cached [파일]# 커밋git commit -m "작업 내용에 대한 설명" github의 원격 저장소에 푸시git push origin 새브랜치이름git push -u origin main//로컬 저장소에서 원격 저장소로 올리기git push origin [브랜치 이름]  Repository에 'main' branch로 push하기gi..

지식 창고 2024.11.24

05장(회원 탈퇴를 예측하는 테크닉), 06장(물류의 최적경로를 컨설팅하는 테크닉)

05장. 회원 탈퇴를 예측하는 테크닉 10전제 조건→ 스포츠 센터의 데이터 import pandas as pdcustomer = pd.read_csv('customer_join.csv')uselog_months = pd.read_csv('use_log_months.csv') 미래를 예측하기 위해 그 달과 1개월 전의 이용 이력(횟수)만으로 데이터 작성year_months = list(uselog_months["연월"].unique())uselog = pd.DataFrame()for i in range(1, len(year_months)): tmp = uselog_months.loc[uselog_months["연월"]==year_months[i]] tmp.rename(columns={"count..

01장(웹에서 주문 수를 분석하는 테크닉), 02장(대리점 데이터를 가공하는 테크닉)

01장. 웹에서 주문 수를 분석하는 테크닉 10목적 : 어떤 기업 쇼핑몰 사이트의 상품 주문 수의 추세를 분석함으로써 판매량 개선의 방향을 찾는 것전제 조건→ 이 쇼핑몰의 주요 품목은 컴퓨터 → 가격대별로 5개의 상품 존재 → 4종류의 6개 데이터 데이터베이스에 들어 있는 데이터를 시스템에서 가져올 때는 월별이나 1,000건 단위로 분할하는 경우가 많음→ 데이터를 결합해 사용해야 함# 경고(warning) 비표시import warningswarnings.filterwarnings('ignore')import pandas as pdcustomer_master = pd.read_csv('customer_master.csv')customer_master.head()  - 파이썬 라이브러리 판다스(pandas)..

1장(통계학이란?), 2장(모집단과 표본), 3장(통계분석의 기초)

1.1 데이터를 분석하다 →  목적에 따라 데이터 획득/분석 방법이 달라짐 1. 데이터 요약 :raw data로는 데이터의 경향을 알기 어려움 → 평균값 등을 통해 데이터를 요약, 정리 필요 2. 대상 설명 :"대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해한다" 실험군 : 실험에서 효과가 기대되는 처리를 한 집단대조군 / 통제군 : 비교, 대조하기 위한 집단단일맹검법 : 피험자에게 안다면 편견 등으로 결과에 영향을 줄 정보를 알리지 않고 실험하는 방법이중맹검법 : 연구자가 무의식적으로 피험자에게 영향을 줄 가능성을 배제하고자 연구자도 정보(약 종류)를 모른 채 실험하는 방법→  모든 가능성을 배제하고 남아있는 것만 확고한 증거가 됨 인과관계 : 2가지 중 하나(원인)를 변화시키면, 다른 하나(결과..

visual stdio LNK1168 쓰기용으로 열 수 없습니다 오류 해결

1. 이렇게 코드 LNK1168 오류가 뜨거나,2. 콘솔창에 아무것도 보이지 않고 멈추거나,3. 코드를 바꿨는데 그 전 출력 결과만 나온다면현재 exe파일이 이미 돌아가고 있어 또 열지 못하는 것!! 3번의 경우 이미 돌아가는 exe파일이 열지 못하는 파일을 대체하어 실행된 것! → 이미 열린 콘솔 닫아주기 1. cmd 창 열기2. tasklist 입력 → 열려있는 exe 파일 찾기 3. taskkill 로 해당 프로그램 킬하기taskkill /? 로 가이드 확인 가능 - taskkill /pid 해당파일의 프로세스 id 로 종료  → 위 사진처럼 종료가 안된다면 taskkill /f /pid 해당파일의 프로세스 id 로 강제 종료 4. visual stdio 다시 실행하기또 안된다면 될 때까지 kill..

지식 창고 2024.09.11

서포트벡터머신, 연관규칙과 협업 필터링

13-5. 서포트벡터머신 (분류 모델)서포트벡터머신(SVM) :- 판별분석처럼 범주를 나눠주는 결정경계선을 찾아 관측치의 범주를 예측하는 모델- 이진 분류에만 사용 가능하지만 비선형 데이터에서 높은 정확도를 보이며 과적합되는 경향도 적은 모델  서포트 벡터  : 결정경계선의 위치와 각도를 정해줄 수 있는 기준이 되는 관측치- SVM에서는 서포트 벡터만으로 결정경계선을 정하게 되며 결정경계선과 서포트 벡터와의 거리가 마진이 됨.- SVM에서는 거리를 기준으로 모델을 만들기 때문에 반드시 데이터 정규화나 표준화를 해주어야 함.독립변수가 k개 일 때, 최적의 결정경계선을 찾기 위해서는 최소 k - 1개의 서포트 벡터가 필요.WX + b = 0W: 가중치 벡터를 의미하며 독립변수 수에 따라 {w1, w2, … ..

모델 평가

14-1. 학습 셋, 검증 셋, 테스트 셋과 과적합 해결 학습 셋과 테스트 셋을 나누고, 학습 셋의 일부의 검증 셋(7:3)으로 분리 Degree 1 : 모델이 너무 단순해서 Y값을 제대로 예측하지 못함, 학습이 너무 덜 된 경우 과소적합(underfitting) Degree 15 : 학습 셋에 과도하게 적합(fit)하도록 학습된 과적합 상태(overfitting) -> 학습이 너무 많이 이루어지거나, 변수가 너무 복잡해서 발생, train 데이터와 test 데이터가 중복될 경우 발생 Degree 5 : 최적의 모델 True function과 가장 유사한 모델 검증셋 : 학습 셋 데이터를 통해 모델을 만들 때 과도하게 학습되지 않도록 조정해주는 역할을 함 -> 검증 셋 데이터는 학습 셋 데이터의 모델 학..

데이터로 말한다! 퍼포먼스 마케팅 4장

4-1. 퍼포먼스 마케팅의 기본은 페이스북(인스타그램) 1. 적은 비용으로 광고를 시작할 수 있다 2. 타 매체 대비 측정이 가능하며 효과적이다 3. 실시간 광고 데이터를 추적할 수 있다 풀퍼널 마케팅 깔때기처럼 생겨서 퍼널(깔때기) 라고 함 -> 풀퍼널 전략(깔떄기 전략) 가장 윗부분 - 도달형 광고(노출형 광고) 2, 3 단계 - 트래픽 광고 구매 단계 - 전환형 광고 더보기 실제로 페이스북 광고 하는 법 알려준다..! 4-2. 구글, 네이버, 카카오, 유튜브, you made it! 최근 퍼포먼스 마케팅은 페이스북, 인스타그램, 카카오, 틱톡, 네이버, 유튜브 등의 다양한 광고 플랫폼으로 확장하고 있음 -> 소비자들의 구매여정에 변화가 생겼기 때문 ! (다양한 플랫폼을 돌아다님) 멀티터치(multi..

카테고리 없음 2024.04.03