📑 목차
AI 모델 훈련 데이터 비용은 사용 목적에 따라 경비가 될 수도, 무형자산이 될 수도 있다.
2025년 기준 AI 데이터 비용의 세무 처리 기준 완전 정리.

AI 기반 창작 시대, 가장 애매한 비용은 ‘데이터 비용’이다
2025년 현재, 크리에이터·AI 연구자·AI 모델러·프롬프트 엔지니어는 단순히 AI 도구를 사용하는 단계를 넘어
직접 모델을 튜닝하고(LoRA), 파인튜닝하고, 데이터셋을 구축하는 단계까지 진입했다.
이 과정에서 발생하는 대표적 비용이 다음 네 가지다.
- 학습용 이미지 패키지 구매비
- 상업용 텍스트·음성·영상 데이터 구매비
- 데이터 레이블링 외주비
- 데이터 수집을 위한 촬영·녹음 비용
문제는 대부분의 창작자가
“이 비용을 경비 처리해도 되는지?”
“학습 데이터가 자산인지 비용인지?”
“데이터셋을 만들면 감가상각이 가능한지?” 를 모른다는 점이다.
더 큰 문제는 세법이 AI 데이터 비용을 기존 규정으로 단순하게 설명할 수 없다는 점이다.
왜냐하면 AI 학습 데이터는 전통적 의미의 재고도 아니고, 물적 자산도 아니고, 무형자산으로 인정하기에도 애매하기 때문이다.
따라서 세법은 AI 데이터 비용을
“그 데이터가 어떤 목적을 위해 사용되는지”
“향후 경제적 가치가 독립적으로 존재하는지”
“수익 창출과 직접 연관되는지” 를 기준으로 판단하고 있다.
이 글에서는 AI 모델 훈련에 사용된 데이터 비용이
어떤 경우에 경비로 인정되고, 어떤 경우에 무형자산으로 처리되며, 어떤 경우에 경비 인정이 거부되는지를
2025년 최신 세법 기준으로 완전 정리한다.
세법이 AI 학습 데이터를 바라보는 기본 원칙 — “데이터 자체는 자산이 아니지만, 목적에 따라 자산이 될 수 있다”
세법은 데이터라는 개념을 다음 두 가지로 나누어 판단한다.
① “소모성 데이터(Data as Input)” → 경비 처리
AI 모델을 학습시키기 위해 일회성으로 사용하는 데이터는 회계·세법상 ‘소모성 비용’으로 본다.
예:
- 이미지 5,000장 다운로드
- 음성 300분 패키지 구매
- 레이블링 외주
- 데이터 정제 비용
이 경우 데이터는 재고처럼 남아있지 않고, 학습 과정에서 소비되며, 독립적 경제적 가치를 가지지 않기 때문에
경비로 인정된다.
② “자산화 가능한 데이터(Data as Asset Base)” → 무형자산
다음 조건 중 하나라도 충족하면 세법은 데이터를 경비로 인정하지 않고 무형자산(자산)으로 처리하도록 요구한다.
조건은 다음과 같다.
- 특정 모델을 구성하는 핵심 자산으로 사용됨
- 향후 재판매 또는 라이선스 계획이 있음
- 동일 데이터셋을 반복적으로 수익 창출에 사용
- 데이터가 사업의 주요 수익원
- 데이터셋 자체가 상품으로 판매 가능
예:
- 캐릭터 요일별 포즈 촬영 5,000컷 → LORA 모델 상품화
- 프리미엄 음성 데이터셋을 제작해 판매
- 자체 구축한 데이터셋으로 반복적으로 모델 튜닝
- AI 콘텐츠 자동 생성 SaaS의 핵심 코어로 사용
이 경우 데이터는 “훈련에 사용되었다”는 사실만으로 경비 처리가 되는 게 아니라
앞으로 반복적이고 장기적으로 경제적 가치를 창출하기 때문에 세법은 자산화해야 한다고 본다.
학습 데이터 비용의 경비 인정 기준 5단계 체크리스트
창작자가 가장 쉽게 판단할 수 있도록 세법 실무에서 실제로 사용하는 기준을 5단계로 정리해 본다.
1단계 — 데이터가 ‘소모성’인지 판단
학습에 사용된 후 재사용이 불가능하거나 별도 가치를 만들지 않는다면 경비.
예: LORA용 얼굴 이미지 수백 장 → 재판매 불가 → 경비
2단계 — 데이터 자체를 판매할 계획이 있는가?
판매 목적이면 자산으로 봄.
예: “AI 모델 데이터셋 판매 페이지 운영” → 무형자산 → 상각 대상
3단계 — 데이터가 회사의 핵심 구조를 이루는가?
예: 웹툰·영상 AI 자동 생성 서비스의 고유 데이터셋 → 핵심 IP → 자산화 필요
4단계 — 동일 데이터를 여러 모델에 반복적으로 적용하는가?
반복 활용되는 데이터는 “수익 창출 기반 자산”으로 본다.
5단계 — 비용 규모가 큰가?
특히 500만 원 이상이면 세무서가 자산화 여부를 필수로 검토한다.
AI 모델 훈련용 데이터 비용의 ‘경비 인정’ 시 실제 회계 처리
경비로 인정받는 경우 다음 네 가지 항목으로 분류한다.
① 교육훈련용 원재료비
이미지·음성·영상 데이터 다운로드 비용.
② 외주 가공비
데이터 정제·레이블링·클리닝 작업 대가.
③ 클라우드 데이터 저장비용
AWS S3·GCP Storage 등 데이터 보관비.
④ 데이터 수집 위한 촬영·녹음 비용
촬영 스튜디오, 음향장비 대여, 모델 비용 등.
세무상 핵심 포인트는 모든 비용이 “수익 창출과 직접 관련”이 있어야 한다는 점이다.
자산으로 처리되는 경우의 세무 영향 — 감가상각 의무 발생
자산으로 처리되는 경우 세법은 다음 조건을 요구한다.
① 무형자산으로 계상
계정과목: 개발비·데이터자산·무형고정자산
② 상각 기간 적용
일반적으로 5년~10년.
③ 해당 자산이 미래 수익 창출의 기반임을 입증
문서화는 필수다.
④ 자산 처분 시 양도차익 과세
데이터셋 판매 시:
→ 양도소득 또는 사업소득 발생
세법이 경비 인정 거부하는 대표적인 사례 TOP 6
아무 자료나 ‘학습 데이터’라고 주장한다고 모두 경비로 인정되는 것은 아니다.
1) 데이터 출처가 불분명하고 구매 증빙 없음
세무서는 증빙이 없으면 비용을 인정하지 않는다.
2) 상업적 이용이 금지된 오픈소스 자료 사용
무료 자료라 하더라도 라이선스 위반이면 비용 인정 불가.
3) 업무용 비율 구분이 안 된 경우
개인학습+업무학습이 섞인 경우 비율 판단 필요.
4) 향후 판매 목적의 데이터인데 비용처리한 경우
세법은 자산화해야 한다고 보며 경정 가능.
5) 인플루언서 개인 사진을 무단으로 데이터로 사용한 경우
법적 문제로 인해 비용 자체를 인정하지 않음.
6) 모델 제작과 무관한 이미지 패키지 일괄 구매
업무 필요성과 연관성이 핵심이다.
크리에이터·AI 개발자가 반드시 해야 할 실전 기록 5가지
AI 데이터 비용은 증빙과 목적성이 명확할수록 경비 인정 가능성이 커진다.
1) 데이터 구매 내역·계약서 보관
출처·범위·저작권·라이선스 포함
2) 학습 기록(Log) 보관
훈련시간, 샘플 개수, 파라미터 구성 등
3) 데이터셋을 어떤 모델에 어떻게 사용했는지 문서화
세무조사 때 핵심 증빙이 된다.
4) 데이터의 재판매 여부 명확히 구분
판매 목적이면 자산, 단순 학습이면 경비.
5) 업무용 비율 산정
개인적 학습과 혼재 시 반드시 분리해야 한다.
결론 — 데이터는 ‘사용 목적’에 따라 경비도 되고 자산도 된다
AI 시대에 데이터는 단순 참고자료가 아니라 미래 수익을 결정하는 핵심 재료다.
세법은 데이터의 본질을 다음과 같이 정의한다.
데이터는 그 자체로 자산이 아니지만, 수익 창출 기반이 되면 자산이고, 단순 학습용이면 경비다.
결국 크리에이터가 해야 할 일은 단 하나다.
- 데이터가 학습 후 소멸되는가? → 경비
- 데이터가 반복적으로 수익을 만든가? → 자산
이 기준에 따라 세법은 처리 방향을 완전히 다르게 적용한다.
'세금' 카테고리의 다른 글
| AI 자동 번역·요약 도구 사용료의 비용 배분 — 업무용 비율 계산 실전법 (0) | 2025.12.06 |
|---|---|
| 크리에이터가 만든 ‘AI 튜닝 모델(LORA·Checkpoint)’의 자산 가치 평가 기준 (0) | 2025.12.06 |
| 크리에이터 법인 전환 시 IP(지적재산권) 이전 과세 문제 (0) | 2025.12.05 |
| 디지털 구독 모델(서브스크립션) 수익의 귀속월 계산 방식 (0) | 2025.12.05 |
| 해외 포트폴리오 작업물과 ‘용역 제공지’ 기준 충돌 문제 (0) | 2025.12.04 |