R (studio) 한글 포함 파일 읽기 진짜 해결법, feat. 한글 깨짐
저는 윈도우를 사용하고 있고, 현재 학교 과제로 R을 공부하고 있는데요. 텍스트 파일이든, csv 파일이든 죄다 utf-8 방식으로 다시 저장하고 Liberoffice까지 동원했는데도 R이 한글 파일을 계속 읽지 못하는 상황이 벌어졌습니다. 다른 사람은 encoding 설정 없이도 잘 읽던데, 아마도 개인의 컴퓨터 환경이나 OS 차이가 존재하겠죠.
계속 해매다가 찾은 방법은 매우 간단하게도 아래의 코드를 입력해주는 것입니다. 이는 R studio 언어도 재설정을 해주는 것으로 에러 메시지 등을 비롯해 전체적인 언어 설정이 지원됩니다. 아래는 "korean"으로 작성되어 있으니 당연히 한국어로 언어 설정을 하는 것이죠.
Sys.setlocale("LC_ALL","korean")
이렇게 하면 아래와 같이 에러 메시지가 한글로 나타나는데, 조금 어색하고 영어랑 별반 차이를 느끼지 못하겠네요. (여전히 잘 알아듣지 못하겠음 ㅎㅎ)
어쨌든 이렇게만 설정해주고 난 뒤 텍스트나 csv 파일을 읽을 때 encoding = "utf-8" 만 추가해주면 문제 없이 읽을 수 있습니다. 다만! 주의할 점은 이때 읽으려는 파일이 utf-8로 저장되어 있을 경우에만 해당되는 것 같습니다. 만약 해당 파일이 utf-8로 특별히 저장되어 있지 않다면 encoding = "utf-8"을 추가로 입력하면 오히려 에러가 생기거나 깨짐 현상이 또 다시 발생합니다. utf-8로 인코딩되지 않은 파일은 그냥 아무런 조건 없이 읽어들일 수 있습니다.
아래의 경우는 utf-8로 저장된 텍스트 파일이라 옵션을 추가해줬습니다.
아래는 utf-8로 인코딩되지 않은 csv 파일인데, encoding = "utf-8" 옵션을 줬더니 정말 희한하게 나오네요..