본문 바로가기

Study40

[Python] ChatGPT 앱 Appstore, Google Playstore 리뷰 크롤링(App ID 확인하기) 01. Appstore 리뷰 가져오기1. app_store_scraper 설치하기!pip install app_store_scraper   2. 리뷰 크롤링from app_store_scraper import AppStore# 1. AppStore Reviewdef extract_appstore_reviews(app_name: str, app_id: int): app = AppStore(country='us', app_name=app_name, app_id=app_id) # country='kr': 한국 app.review() app_reviews = pd.DataFrame(app.reviews) if 'date' not in app_reviews.columns: app.. 2024. 12. 19.
[R/Markdown] RStudio 한글 폰트 적용하기(나눔고딕) 👀 내가 보려고 쓰는 글    01. 폰트 다운받기 1. 폰트 다운받기(네이버 글꼴 모음 : https://hangeul.naver.com/font)         02. 파일 경로 찾기 1. 작업표시줄 검색창에서 C:\Windows\Fonts 경로 입력해서 들어가기  2. 해당 경로에 다운받은 폰트 붙여넣기     + 폰트 설치 확인하기1. 콘솔에서 아래 명령어 실행하기install.packages('extrafont')library(extrafont)fonttable()  2. 폰트 설치된 항목 확인하기        📌 참고.  https://funnystatistics.tistory.com/19 [R/R마크다운] R에 폰트 적용시 주의사항 및 에러/원하는 폰트(글씨체) 추가할 파일 경로안녕하세요.. 2024. 10. 2.
[Neo4j] Neo.ClientError.Security.Unauthorized Error 해결하기(Neo4j 비밀번호 바꾸기) 오류 Visual Studio에서 Neo4j를 연동하려는데 Neo.ClientError.Security.Unauthorized Error라는 오류가 발생했다.   # Neo4j driver settinguri = "bolt://localhost:7687" # Neo4j instance URLusername = "neo4j" # Neo4j account namepassword = "0000" # Neo4j passworddriver = GraphDatabase.driver(uri, auth=(username, password))session = driver.session()# basic returnq = 'MATCH (n) RETURN n'nodes = se.. 2024. 8. 7.
[Neo4j] Cypher Query 기본 문법 및 예제 01. 기본 문법 Basic returnMATCH (n)RETURN n   Create a simple node with propertiesCREATE (:NodeName {name: "James Dean", age: 24})   Update return with column namesMATCH (n)RETURN n.name AS Name, n.age AS Age   Delete all element in the database(delete all nodes and edges)MATCH (n)DETACH DELETE n       02. 예제 #1 Two nodes and relationship between User id 0 is interested in the item id 0 CREATE (a:U.. 2024. 8. 6.
[Kaggle] 아마존 리뷰 분석 #02(EDA, 감정분석) 🗂️ 데이터셋.https://www.kaggle.com/datasets/tarkkaanko/amazon   1. 시각화 리뷰 평점 시각화contraints로 pie chart 색상 구분5.0점대 평점 비율이 79.8%로 가장 높음# 리뷰 평점 확인constraints = ['#4682B4', '#FF6347', '#32CD32', '#FFD700', '#8A2BE2']def categorical_variable_summary(df, column_name): plt.figure(figsize=(10, 5)) # Countplot plt.subplot(1, 2, 1) df[column_name].value_counts().plot(kind='bar', color='skyblue') .. 2024. 6. 23.
[Kaggle] 아마존 리뷰 분석 #01(데이터 불러오기, 전처리) 🗂️ 데이터셋.https://www.kaggle.com/datasets/tarkkaanko/amazon   0. Introduction 텍스트 마이닝 기법을 활용해서 고객 리뷰를 분석하고 이를 통해 고객이 만족하는 서비스 요인과 불만족하는 서비스 요익을 파악하고자 함     1. 데이터 불러오기 Kaggle에서 제공하는 'amazon reviews' 데이터 불러오기# library setting!pip install chart_studio!pip install TextBlob!pip install plotly!pip install WordCloud!pip install cufflinks!pip install SentimentIntensityAnalyzer!pip install vaderSentiment.. 2024. 6. 21.
[Git] Github 오픈소스 가져오기 👀 내가 보려고 쓰는 글  01. 오픈소스를 내 Github로 가져오기 1. 가져올 오픈소스 우측 상단 있는 [Fork > Create a new fork] 누르기   2. Repository name, Description 확인하고 [Create fork] 누르기         02. 내 Github에서 컴퓨터로 받기 1. 우측 상단에 있는 [Code > Local > HTTPS] 에서 url을 복사하기    2. 명령 프롬프트 실행하기   3. 프롬프트로 Github계정 연결하기git config --global user.name (github name)git config --global user.email (github email)     4. 컴퓨터에 코드를 불러올 파일 생성하기   5. 프롬프.. 2024. 6. 19.
[Python] Google Colab 단축키 👀 내가 보려고 쓰는 글  Ctrl + M, B : 코드 셀 삽입Ctrl + M, D : 코드 셀 삭제 Ctrl + M, K : 코드 셀 위로 이동Ctrl + M, J : 코드 셀 아래로 이동Ctrl + M, Z : 코드 셀 삭제 실행 취소     Ctrl + F9 : 모두 실행Ctrl + F8 : 이전 셀 모두 실행Ctrl + F10 : 이후 셀 모두 실행 (모두 실행하다가 오류 나면 그 이후 셀부터는 모두 실행이 안 돼서... 유용하게 썼다)Ctrl + Enter : 해당 셀 실행 2024. 6. 4.
[Python] Google Colab에서 'TfidfVectorizer' object has no attribute 'get_feature_names' Error 해결하기 오류 토픽 모델링 예제 실습 중 'TfidfVectorizer' object has no attribute 'get_feature_names'라는 오류가 발생했다.       해결방법   get_feature_names를 get_feature_names_out()로 변경한다. # sklearn 버전 이슈로 메서드 변경terms = vectorizer.get_feature_names_out()# 각 20개 행의 1,000개 열 중 가장 값이 큰 5개를 찾아서 단어로 출력def get_topics(components, feature_names, n=5): for idx, topic in enumerate(components): print("Topic %d:" % (idx+1), [(feat.. 2024. 5. 31.
[ML] Evaluation Metrics 01. Evaluation Metrics in Regression Models MAE(Mean abolute error)예측 값과 실제 값 차이의 절댓값MSE(Mean squared error) 회귀모델에서 학습하는 error function과 동일한 형태RMSE(Root mean squared error) MSE의 값에 루트를 씌운 형태가장 널리 활용      02-1. Evaluation Metrics in Classification Models(binary classification) binary classification : confusion matrix를 이용하여 accuracy이나 precision, recall 등을 평가함  Accuracy전체 test set에 있는 샘플 중에서 얼마나 맞췄.. 2024. 3. 26.
[ML] Cross-Validation 01. Hold-out Method 모델을 평가하기 위해서는 training data set과 test data set이 필요함전체 data를 두 개의 형태로 나눈 뒤 training data는 모델을 학습할 때, test data는 학습이 끝난 후 모델의 성능을 평가할 때 사용data set은 random 하게 나누어야 하며 서로 중복되면 안 됨test data로 가장 성능이 좋은 모델을 선택하는 것이 hold-out methodHold-out Method 단점Random split : data set을 random 하게 나눌 때 data가 한쪽으로 지우 칠 경우 성능이 달라질 수 있음Waste of data : 하나의 data set이 training data set에서는 사용되고 test data .. 2024. 3. 26.
[Python] 문자열 slice 👀 내가 보려고 쓰는 글  문자열 slice 문자열 앞의 n글자 : str[:n] 문자열 뒤의 n글자 : str[ -n :] 문자열 역순 : str[::-1] 2024. 3. 20.
[Python] enumerate 함수(with 프로그래머스>부분 문자열 이어 붙여 문자열 만들기) 📝 문제.https://school.programmers.co.kr/learn/courses/30/lessons/181911  enumerate(iterable, start=0) iterable : 순서가 있는 이터레이터 입력start : 시작 시퀀스, 기본값 0, 특정 value로 설정 가능for문에서 index, value 동시에 확인할 때 사용할 수 있음 seasons = ['Spring', 'Summer', 'Fall', 'Winter']list(enumerate(seasons))#[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]list(enumerate(seasons, start=1)) # 시퀀스 시작 숫자를 1로 지정#[(1, 'Spri.. 2024. 3. 20.
[Python] endswith 함수(with 프로그래머스>접미사인지 확인하기) 📝 문제.https://school.programmers.co.kr/learn/courses/30/lessons/181908   str.endswith(접미사[,start [,end]])문자열이 지정된 접미사로 끝나면 True, 그렇지 않으면 False 반환접미사: string이랑 tuple만 사용할 수 있음start : 선택 입력 사항, 입력 시 해당 value부터 문자열 비교end : 선택 입력 사항, 입력 시 해당 value까지 문자열 비교 String에서 endswith( ) 함수 사용ex_str = "It’s been a long time!"ex_str.endswith('time!') # Trueex_str.endswith('time') # Falseex_str.endswith('!') # T.. 2024. 3. 20.
[Python] Google Colab에서 name 'tqdm' is not defined Error 해결하기 오류 한국어 Word2Vec 만들기 예제 실습 중 name 'tqdm' is not defined라는 오류가 발생했다.      해결방법 tqdm 패키지를 설치해 준다. # tqdm 패키지 설치!pip3 install tqdmfrom tqdm import tqdm         📌 참고. https://stackoverflow.com/questions/47529792/no-module-named-tqdm No module named 'tqdm'I am running the following pixel recurrent neural network (RNN) code using Python 3.6 import os import logging import numpy as np from tqdm import .. 2024. 3. 4.
728x90