여기저기서 복사한 뒤죽박죽 텍스트를 깔끔한 표(CSV)나 JSON으로 정리해야 할 때, Claude에 붙여넣고 “이렇게 정리해줘”라고 하면 됩니다. 이 글은 비정형 텍스트를 구조화된 데이터로 정제·변환하는 실전 방법 — 표 만들기, 형식 통일, 중복·오타 정리, 필드 추출 — 을 정리합니다. (Claude가 정리한 데이터는 양이 많을수록 누락·오류가 생길 수 있으니 결과를 꼭 확인하세요.)
1. Claude가 해주는 데이터 정제
“정제”라고 하면 거창하지만, 실무에선 이런 작업입니다.
- 표로 만들기: 줄줄이 적힌 목록·명단을 행과 열이 있는 표(CSV)로
- 형식 통일: 제각각인 날짜(2026.6.22 / 6월 22일), 전화번호, 단위를 한 형식으로
- 중복·오타 정리: 같은 항목 합치기, 띄어쓰기·오타 교정
- 필드 추출: 문장 속에서 이름·금액·날짜 같은 값만 뽑아 정리
2. 좋은 정제 요청 만들기
세 가지를 함께 주면 결과가 깔끔합니다: 원본 + 원하는 형식 + 규칙.
“아래 텍스트를 CSV로 정리해줘. 열은 이름, 연락처, 가입일 순서로. 날짜는 YYYY-MM-DD 형식으로 통일하고, 중복된 사람은 합쳐줘. [텍스트 붙여넣기]”
- 열(필드) 이름과 순서를 직접 지정하기
- “빈 값은 빈칸으로 두기”, “단위는 원으로 통일” 같은 규칙 명시
- 결과를 코드블록으로 달라고 하면 복사가 쉽습니다
3. CSV로 받을까, JSON으로 받을까
- CSV: 엑셀·구글 시트에 바로 붙여넣을 표 데이터. 단순한 행·열에 적합합니다.
- JSON: 프로그램에서 쓰거나, 한 항목 안에 여러 하위 값이 있는 중첩 구조에 적합합니다.
“엑셀에 넣을 거면 CSV, 코드에서 쓸 거면 JSON”이 간단한 기준입니다.
주의할 점
- 양이 많으면 검증: 행이 수백 개면 일부가 누락되거나 잘못 정리될 수 있습니다. 개수를 세어 확인하고, 너무 크면 나눠서 처리하세요.
- 원본 값 보존: Claude가 값을 ‘추정’해 채우지 않도록 “없는 값은 비워두라”고 지시하세요.
- 민감 정보 주의: 실제 개인정보·고객 데이터는 그대로 붙여넣기보다 가리거나 예시 값으로 바꾸세요.
자주 묻는 질문
Q. 표·JSON 같은 출력 형식을 더 자세히 지정하고 싶어요.
출력 형식 지정 전반은 따로 정리해 두었습니다. → Claude 출력 형식 지정하기
Q. 개발에서 JSON 출력을 ‘보장’받고 싶어요.
API에서는 스키마로 출력을 강제할 수 있습니다. → Claude API 구조화된 출력
Q. 데이터가 너무 길어서 잘려요.
한 번에 넣는 양을 줄여 나눠 처리하고, 각 결과를 이어 붙이세요.
직장인 업무 전반은 직장인을 위한 Claude 업무 활용법도 함께 참고하세요.