본문 바로가기

데이터셋(Data Set) 판매 수익은 어떤 소득으로 귀속되는가?

📑 목차

    데이터셋 판매 수익은 반복성·권리 구조·판매 방식에 따라 사업소득·기타소득·저작권 소득으로 달라진다.

    2025년 기준 소득 분류 기준 완전 정리.

    데이터셋(Data Set) 판매 수익은 어떤 소득으로 귀속되는가?

     

    AI 시대, 크리에이터는 더 이상 콘텐츠만 파는 존재가 아니다. 이제는 ‘데이터’를 판매한다

    2025년, 크리에이터·AI 모델러·프롬프트 엔지니어·리서처는 단순히 영상·이미지를 만드는 단계를 넘어
    직접 구축한 데이터셋(Data Set)을 판매하며 새로운 수익원을 만들고 있다.

     

    판매되는 데이터셋은 매우 다양하다.

    • 이미지 데이터셋(인물·배경·패턴·제품사진)
    • 음성 데이터셋(발음·감정·언어별 코퍼스)
    • 텍스트 데이터셋(스크립트·대사·Q&A·요약본)
    • 모델 학습용 데이터 패키지
    • 정제된 연구 데이터
    • 라벨링된 산업용 데이터

    문제는 데이터셋 판매가 늘어나면서 세법이 이 수익을 ‘소득 분류’ 관점에서 기존 디지털 상품과 다르게 본다는 점이다.

     

    대부분의 크리에이터는 이렇게 말한다.

    “데이터셋 팔았으니 디지털 상품 판매니까 그냥 사업소득 아닌가?”
    “클라우드에 올려놓고 다운로드 받게 했는데, 이건 용역인가? 재화인가?”
    “원본 사진 촬영해서 만든 데이터인데 저작권 소득인가?”

     

    그러나 세법의 답은 매우 다층적이다.

    데이터셋이 어떤 방식으로 만들어졌고, 어떤 형태로 판매되었고,
    어떤 권리가 이전되는지에 따라 소득 분류가 완전히 달라진다.

     

    소득 분류가 달라지면 부가세·경비·세율·원천징수·해외 과세 등 모든 규정이 바뀐다.

    오늘 글에서는 데이터셋(Data Set) 판매 수익이 2025년 세법 기준으로 어떤 소득으로 귀속되는지 완전히 정리해준다.


    세법은 데이터셋을 “재화”로 보지 않는다. 데이터셋은 ‘지식 기반 자산’이기 때문이다

    많은 사람들이 데이터셋을 “파일 다운로드 상품 → 재화 판매”라고 생각하지만 세법은 그렇게 보지 않는다.

    이유 1 — 데이터는 물리적 형태가 없다

    → 무형자산 또는 정보 제공 서비스로 분류

    이유 2 — 판매의 본질이 ‘권리 제공’

    → 데이터 자체의 복제권 또는 사용권을 판매하는 구조

    이유 3 — 데이터 품질이 결과물 가치 결정

    → 창작물 또는 연구성과 성격을 가짐

     

    세법은 데이터셋을 기본적으로 다음 3가지 유형 중 하나로 판단한다.


    유형 1 — “사업소득(Business Income)”

    데이터셋을 반복적·지속적·영리적으로 판매하면 사업소득이다.

    가장 일반적인 유형.

     

    예시:

    • AI 모델러가 LORA 학습용 이미지셋 판매
    • 사진작가가 인물·패션 데이터셋 판매
    • 텍스트 라벨링 데이터 패키지 판매
    • HuggingFace·Gumroad·Notion 등 플랫폼 판매

    조건:

    • 판매 사이트 운영
    • 반복된 거래
    • 판매 템플릿·자동화된 공급
    • 고객 다수

    - 이 경우 부가세 과세 대상
    - 필요경비 대폭 인정
    - 사업자 등록 권장
    - 해외 판매 시 원천지 규정 적용


    유형 2 — “기타소득(Other Income)”

    다음 조건이면 사업소득이 아니라 기타소득이다.

    • 일시적 판매
    • 반복 판매가 아님
    • 본업과 무관
    • 독립적 거래·일회성 거래

    예시:

    • 연구 프로젝트 중 얻은 데이터셋을 한 번 판매
    • 기존 촬영 자료 일부를 특정 기업에 제공
    • LORA 모델 학습용 데이터 촬영 후 단발 제공

    - 8.8% 필요경비 인정(표준)
    - 22% 원천징수 가능성
    - 부가세는 보통 비과세

     

    유튜버·프리랜서가 “이번에만 한 번 판매했다”면 기타소득 가능성이 높다.


    유형 3 — “저작권·지식재산권 소득(Royalty Income)”

    데이터셋 자체가 다음 조건을 갖추면 소득이 ‘저작권 사용료’로 귀속된다.

    • 데이터가 창작물 성격(특히 음성·텍스트·이미지 직접 제작)
    • 데이터셋이 독창적
    • 사용자에게 사용권(라이선스)만 부여
    • 소유권은 판매자가 유지
    • API 기반 사용 모델

    예:

    • 음성 데이터셋의 상업 라이선스 판매
    • 독창적 AI 학습 코퍼스 제공
    • 텍스트·대사·시나리오 데이터셋 라이선스
    • 고유 캐릭터 기반 이미지셋

    - 저작권 소득은 부가세 비과세
    - 원천징수 3% 적용 가능
    - 라이선스 계약 필수

     

    특히 음성·텍스트 기반 데이터셋은 저작권 판정이 발생할 가능성이 높다.


    데이터셋 판매 수익 소득 분류를 판단하는 6가지 핵심 기준

    세무서는 다음 6가지 기준을 종합적으로 보고 소득 유형을 판정한다.


    기준 1 — 판매가 반복적인가?

    반복 판매 → 사업소득
    일회성 → 기타소득


    기준 2 — 데이터셋 제작 과정을 ‘창작’으로 보나?

    고유 창작물 기반 → 저작권 소득
    기존 자료 단순 정제 → 사업·기타소득


    기준 3 — 소유권을 이전했는가? vs 사용권만 넘겼는가?

    소유권 이전 → 사업 또는 기타소득
    사용권 부여 → 로열티 소득


    기준 4 — 데이터셋의 주요 고객이 누구인가?

    대량 판매 → 사업소득
    기업 대상 맞춤형 → 용역/기타소득
    라이선스 → 저작권 소득


    기준 5 — 판매 방식이 디지털 다운로드인가? API인가?

    다운로드 → 재화성 낮음 → 사업소득
    API 제공 → 서비스 성격 → 용역·저작권 소득 가능


    기준 6 — 판매 플랫폼이 자동 결제인가?

    HuggingFace·Gumroad 자동 결제 → 사업소득 신빙성 매우 높음


    데이터셋 수익 유형별 세무 처리 차이 — 반드시 알아야 하는 핵심 표

    아래 표는 크리에이터가 가장 많이 혼동하는 부분이다.

    구분 사업소득 기타소득 저작권소득(사용료)
    반복 판매 가능(라이선스만)
    부가세 과세 비과세 비과세
    원천징수 없음 22% 3%
    필요경비 실제비용 인정 60% 또는 8.8% 실제 경비
    사업자등록 필수 선택 선택
    계약방식 판매계약 일시용역 라이선스계약
    해외과세 수익 귀속국 판정 필요 국가 따라 다름 조세조약 적용

    이 표 하나만으로도 대부분의 분류가 해결된다.


    데이터셋 제작 비용의 경비 인정 기준

    데이터셋 판매자는 다음 비용을 필요경비로 인정받을 수 있다.

    • 촬영 비용
    • 음성 녹음 비용
    • 레이블링 외주비
    • AI 훈련비(GPU·클라우드)
    • 데이터 정제·가공비
    • 스튜디오·장비 대여비
    • 협업 인건비
    • 판매 플랫폼 수수료

    단, 저작권 소득으로 분류되면 부가세는 비과세이지만 경비는 철저한 증빙이 필요하다.


    세무서가 데이터셋 소득을 문제 삼는 사례 TOP 6


    1) 소득을 기타소득으로 신고했는데 반복 판매 기록 존재

    → 사업소득으로 재분류 → 가산세 발생

    2) 데이터 라이선스인데 판매로 신고

    → 저작권 소득 비과세 혜택 놓침

    3) 동의 없는 타인의 음성·이미지로 만든 데이터셋 판매

    → 소득 전액 부인 + 법적 분쟁 리스크

    4) 판매 플랫폼 수수료 누락

    → 매출·경비 불일치

    5) 데이터셋의 원본 출처가 불명확

    → 필요경비 부인 가능

    6) 해외 판매 수익을 원천지 규정 없이 단순 매출로 처리

    → 외국납부세액공제 문제 발생


    결론 — 데이터셋 소득은 “판매 구조와 권리 구조”에 따라 완전히 다른 소득이 된다

    세법의 최종 결론은 매우 명확하다.

    데이터셋이 한 번 팔리면 일회성 수익이지만, 데이터셋이 반복적으로 팔리면 ‘사업’이 된다.

     

    그리고,

    소유권을 넘기면 판매수익, 사용권만 넘기면 저작권 소득이다.

     

    데이터셋은 단순 파일이 아니라 법적 권리와 수익구조가 결합된 무형자산이다.

    따라서 데이터셋을 판매하는 크리에이터는

    • 판매 방식
    • 반복성
    • 소유권 구조
    • 라이선스 계약
    • 플랫폼 수익 흐름을 명확히 기록해야 세무 리스크를 피할 수 있다.