목록
아래로
위로

[Python] 파일을 읽어서 각 행을 리스트로 만드는 5가지 방법

0
이니스프리
2018.11.25. 22:16
조회 수 24483

파이썬으로 스크립트를 작성하다보면 텍스트 파일을 읽어서 각 행을 리스트 변수에 넣어야 하는 경우가 종종 있죠.

이하 filename.txt라는 파일의 각 행을 (line이란 변수에 넣어서) 최종적으로 list_file이란 리스트 변수에 대입하는 것으로

파일명과 변수명을 통일하여 설명해 보겠습니다 ^^

물론 다른 라이브러리를 사용하는 방법도 가능하지만 경우의 수가 너무 많아지니 배제할게요.

1. 다음과 같이 파일 객체를 readlines로 한 줄씩 읽고 각 줄의 끝에 붙은 '\n'을 지워주는 방법을 생각해볼 수 있습니다.

with open('filename.txt', 'r') as f:
    list_file = f.readlines()
list_file = [line.rstrip('\n') for line in list_file]

다만 이 방법은 빅데이터처럼 아주 큰 파일을 다룰 때 readlines()가 효율적이지 않고

때로는 메모리 관련 에러를 유발할 소지가 있다는 문제점이 있죠.

2. 파일 객체를 한 줄씩 배열로 더 해주는 방법도 생각해 볼 수 있습니다.

with open('filename.txt', 'r') as f:
    list_file = []
    for line in f:
        list_file.append(line)

append()가 속도가 빠른 것은 아니지만 이 방법이 1번보다 조금 더 효율적이고 안정적이라고 볼 수 있겠네요.

3. 심플하게 파일 객체를 '\n'으로 나눠서 각 요소를 리스트에 넣는 방법도 있습니다.

list_file = open('filename.txt', 'r').read().split('\n')

close()를 하지 않아도 대개의 경우 별다른 문제가 발생하지 않지만 모든 경우에 그런 것은 아니죠.

4. 다음과 같이 List Comprehension 한 줄로 처리하는 방법도 있습니다.

list_file = [line.rstrip('\n') for line in open('filename.txt', 'r')]

파이썬다운 문법이긴 한데 3번과 같은 문제점이 있기는 합니다.

5. '\n' 단위로 요소를 리스트에 넣되 '\n'을 ''로 바꿔주는 함수인 splitlines()를 이용할 수도 있습니다.

with open('filename.txt', 'r') as f:
    data = f.read()
file_list = data.splitlines()

제가 보기에는 특별한 단점은 없는 것 같네요. ~~솔직히 어떤 문제점이 있는지는 잘 모르겠습니다 ㅠㅠ~~

원래 파이썬은 '가장 아름다운 하나의 답이 존재한다'라는 철학을 베이스로 하는데

저도 파이썬에 대해 잘 알지도 못하면서 작성하다보니 중구난방식의 글이 되어버렸네요 ㅠㅠ

스포어의 파이썬 고수님들께서 보시기엔 헛소리를 늘어놓는 것처럼 보일 수도 있겠네요.

그럼 굿밤 되세요~!

작성자

이니스프리 119 Lv. (3%) 5107750/115200000EXP

Make StudyForUs Great Again!

권한이 없습니다.

번호	제목	글쓴이	날짜	조회 수
공지	[모니터링중] 서버 불안정 해결 안내 3	마스터	26.06.25.21:18	17433
공지	[중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 7	마스터	23.01.14.02:23	434868
553	윈도우 Apple Devices 앱 1109 에러 해결 방법	이니스프리	26.04.26.22:00	357
552	일부 GIF 파일을 ImageMagick으로 처리 시 이미지가 깨지는 경우 해결법	제르엘	25.05.18.02:25	2159
551	[Python] installing Geopandas in Windows (Trouble shooting) 1	이니스프리	24.10.25.20:10	2014
550	[Nextcloud] 프로세스가 kill 되는 문제에 관한 Troubleshooting 3	이니스프리	24.09.30.19:53	2349
549	[펌] Contabo VPS 관련 최근 정보글	이니스프리	24.09.29.21:11	1648
548	[Python] PDF 파일을 특정 페이지를 기준으로 두 개로 나누기	이니스프리	24.08.11.20:27	2268
547	[Python] Youtube API를 사용하지 않고 특정 채널의 모든 비디오 URL을 가져오기	이니스프리	24.06.09.22:12	1965
546	HDMI 단자의 QHD 출력을 정식으로 지원하지 않는 NVIDIA 그래픽 카드로 QHD 60 Hz 해상도 출력하기 2	제르엘	24.06.09.17:45	2905
545	[Python] cannot import name 'TypeAliasType' from 'typing_extensions' 에러 대응방법	이니스프리	24.06.01.23:54	1779
544	[VSCode] 1개의 OS에 VSCode 여러 개를 설치 및 구동하기	이니스프리	24.05.26.05:09	1792
543	[Python] 리스트에 중복된 원소가 있는지 확인하는 함수	이니스프리	24.05.22.20:21	1830
542	[Python] random 함수가 계속하여 동일한 결과를 출력할 때 해결방법	이니스프리	24.05.15.19:32	2153
541	트래픽 절감 관련 모 커뮤니티 사이트의 회의 결과	이니스프리	24.05.15.16:51	1824
540	[Python] SSL: CERTIFICATE_VERIFY_FAILED에 대한 대처 방법 (2)	이니스프리	24.05.05.21:04	1720
539	[KT] 오피스넷 가정 설치 관련	이니스프리	24.05.05.00:28	1670
538	[Python] 쿠팡 크롤링할 때 소소한 팁	이니스프리	24.05.02.21:50	1603
537	[Python] dictionary 2개의 평균을 구하여 내림차순 정렬하기	이니스프리	24.04.21.17:29	1465
536	[Python] 독일어, 스페인어, 체코어 등 철자를 영문 알파벳으로 전환하기	이니스프리	24.04.21.17:15	1433
535	[Python] Tabulate 모듈로 작성한 테이블을 파일로 저장할 때 에러가 발생하는 경우	이니스프리	24.04.20.23:45	1346
534	[Python] 변수의 이름을 반환하는 함수	이니스프리	24.04.20.23:29	1572

번호

제목

글쓴이

날짜

조회 수

공지

[모니터링중] 서버 불안정 해결 안내 3

마스터

26.06.25.21:18

17433

공지

[중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 7

마스터

23.01.14.02:23

434868

553

작성자 이니스프리 119 Lv. (3%) 5107750/115200000EXP

댓글 0

검색

로그인

작성자

이니스프리 119 Lv. (3%) 5107750/115200000EXP