Data/Python3 [데이터 프레임] 리스트로 파일 불러와서 데이터프레임 합치기 논문 프로젝트를 위해 웹크롤링을 통해 각 날짜별로 데이터를 저장하였다. 이들을 모두 불러와 하나의 데이터프레임으로 저장하려고 한다. 1. 먼저 파일 이름을 리스트로 불러온다. import os path='./corpus_daily/' # 파일리스트 받아오기 & 빈 리스트 생성 file_list, tsv_list = os.listdir(path), list() #tsv 형태로 되어 있는 파일 이름(날짜)만 받아와서 빈 리스트에 넣기 for file in file_list: if file.split(".")[-1]=='csv': tsv_list.append(file) tsv_list.sort(reverse=False) 2. 1) create_df : 각 파일을 데이터 프레임으로 만드는 함수 2) concat.. 2022. 10. 3. [정규표현식] 특수문자에 뒤덮힌 데이터에서 특정 형태의 문자열 가져오기 친구의 프로젝트를 도와주면서하게 된 정규표현식 공부 및 실습 먼저, 데이터는 xml 형식으로 되어있었고, 이것은 pandas df 로 바꾼 상태. 데이터를 먼저 불러오며 이렇게 난해하게 생겼다. import pandas as pd datafile=pd.read_csv("C:/Users/user/Desktop/datafile.csv", delimiter=',',names=['text'], encoding="utf-8") datafile['text']=datafile['text'].astype("string") datafile.head() 각 데이터는 수많은 숫자 및 특수문자를 포함하고 있다. 여기서 해야되는 작업은 1) 단어 / POS 형식으로 되어있는 형태로 데이터 가져오기 2) 뒤에 있는 /POS 를 .. 2022. 10. 3. [Python] datetime 포맷팅 today = datetime.datetime.now() print(today) print(today.strftime("%A, %B %dth %Y")) 2022. 4. 15. 이전 1 다음