교재를 가지고 열심히 파이썬 독학에 돌입했다. 그런데 이 책은 출판년도가 2017년이라 벌써 4년 정도 된 책이다.
서울시 홈페이지 등에서 다운받을 수 있는 공공 데이터의 파일양식이 그새 좀 바뀌었다.
내가 가지고 있는 파일은 텍스트형식인데 교재에서 설명하고 있는 파일은 엑셀 형식이라 코드에 자꾸 에러가 난다.
처음에는 코드를 이리저리 조금 바꿔서 에러를 해결하려고 했는데 잘 안 된다. 하다가 안 되겠어서 txt 파일을 xlsx 파일로 바꿔주는 코드를 찾아내서 입맛에 맞게 변형해보았다.
데이터 프레임 Dataframe 을 이용함. 우선 읽어들인 다음 변환하였다.
df = pd.read_csv('파일경로/변환 전 파일이름.txt',sep="\t",encoding='utf-8')
print(df)
df.to_excel('변환 후 새로 생기는 파일이름.xlsx',index=True)
sep="\t" 부분은 텍스트 문서 글자와 글자 사이가 탭으로 분리되어 있다는 말이다. 콤마로 분리되어 있다면 t대신 ,를 써준다.
한글로 작성된 문서라 utf-8로 작성.
index=true로 설정하면 첫 열에 0,1,2,3,...으로 이어지는 리스트가 한 줄 생성된다. false로 하면 안 생긴다.
이번엔 만들어진 엑셀 파일을 data폴더로 옮긴 다음, 이 파일을 다시 txt로 바꾸어보자.
코드는 거의 동일하다.
df = pd.read_excel('파일경로/변환 전 파일이름.xlsx')
print(df)
df.to_csv('변환 후 새로 생기는 파일이름.txt',index=True)
파일이 저장된 폴더로 가보니 텍스트 파일, 엑셀 파일이 모두 잘 만들어졌다.
텍스트파일, 엑셀파일 상호 변환 성공!!!
아래 캡쳐본의 빨간색 박스가 원 파일, 파란색 박스가 변환 2번 거친 파일이다.
index=true가 두번 들어가서 앞 열에 숫자 0~8 이 두번, 자료 구분 문자를 따로 안정해주니 탭구분이 콤마구분으로 바뀌었다. 실전 코딩 시 참고해야겠다.
[왕초보 Python] 프로젝트 하듯 익히는 파이썬 독학 교재 추천 (2) | 2020.12.11 |
---|---|
[왕초보 Python] 프롤로그 & 아나콘다 다운받기 (0) | 2020.12.11 |
댓글 영역