来源:第一财经
AI模型训练中视频内容的版权问题尚无明确法律评判依据。
2月9日,港股高开,恒生指数涨1.66%,恒生科技指数涨1.38%。港股大模型、AI应用方向午后拉升,智谱涨37.2%,MINIMAX涨12.04%。
消息面上,开源证券发布研报称,字节跳动上线Seedance2.0视频生成模型,引发AI产业界广泛测评与讨论,该模型支持文字、图片、视频、音频等各类素材输入生成视频,在自运镜和分运镜、全方位多模态思考、音画同步生成、多镜头叙事能力等几个关键能力上实现突破。
行业内,多位AI创作者对Seedance2.0给予较高评价。但科技博主Tim(本名潘天鸿)在评测过程中发现,仅提供照片、未提供声音或视频等素材的前提下,Seedance2.0能够生成带有Tim个人音色的声音与公司大楼画面,人工智能领域持续遭受质疑的语料版权问题再次引发关注。
好用但“有点恐怖”
科技博主Tim表示,Seedance2.0产出的内容虽不说完美无缺,但能明显感知到较以往AI视频模型质量强很多。但是,Tim提出一点:当他将自己照片与提示词上传至Seedance2.0,未提供个人视频或音频等内容,模型会自动匹配Tim本人的声音。
另外,当Tim上传一张公司照片,Seedance2.0生成的视频会自动匹配公司大楼另一面的景象,即便上传人并未提供这方面的信息。“这基本上可以确定一件事,Seedance2.0大量训练了我们公司的视频。”Tim称。
截至发稿,字节跳动方面暂未对此事进行回应。Tim表示,抖音平台用户协议中可能隐藏了类似的授权条款,但他本人明确没有进行授权,也没有字节跳动的工作人员前去联系他进行版权申请。另外,Tim团队还用Seedance2.0测试生成另一位科技博主何同学的内容,人物形象一致性也很高,但该视频使用的声音仍旧是Tim的声音。“这在法理上可能是合规的,但有点恐怖。”Tim称。
记者搜索发现,Tim作为创始人的数码影视自媒体“影视飓风”在抖音已有1178.9万粉丝,已发布视频作品428条。
抖音用户服务协议第10.3条内容显示,为使用户的作品得到更好的分享及推广,提高其传播价值及影响力,对于用户通过抖音上传发布的各种形式的内容,如文字、图片、音视频、直播及其中包括的音乐、声音、台词、视觉设计、对话等所有组成部分,用户授予抖音一项全球范围内、免费、非独家、可多层次再许可的权利,包括修改权、复制权、翻译权、汇编权、信息网络传播权、改编权及制作衍生品、表演和展示的权利等。
上述权利的使用范围包括在抖音或其他网站、应用程序或智能终端设备等产品上使用。用户同意抖音有权自行或许可第三方在与上述内容或抖音有关的任何宣传、推广、广告、营销和/或研究中使用,也可以通过其他方式开发全部或部分内容。
简而言之,即抖音可以免费在全球范围内使用用户上传的所有内容,用途包括广告、营销、研究开发等。
版权问题难解
目前视频模型或多模态模型训练,训练数据来源主要以互联网公开视频数据为主,由此导致的版权问题持续发生,涉及企业包括Anthropic、OpenAI、Stability AI等。
近日,美国版权人起诉英伟达公司使用盗版素材进行AI训练的案件备受关注。据诉状披露,为了尽快获得高达近500TB的文件,英伟达主动联系了盗版网站“安娜的档案(Anna's Archive)”,支付数十万美元费用下载了大量包括书籍、文章等受著作权保护作品的盗版内容。
上海大邦律师事务所高级合伙人游云庭表示,字节跳动旗下Seedance2.0模型训练数据的版权问题,关于训练是否要取得著作权人同意的问题,因人工智能是新生事物,原有著作权法上的合理使用目前尚无定论。这不仅是中国著作权法上的问题,也是美国市场经常碰到的问题。最新美国判例认定,只要人工智能训练具有转换性,可以生成新内容,而不是对于原来作品做市场替代,没有不合理损害著作权人权益的,可以适用转换性使用,也就是构成合理使用。
目前,游云庭称,我国司法实践上也没有定论,其团队所代理的几个涉及人工智能训练是否构成侵权的诉讼,目前法院都处于终止审理状态,他认为主要因为AI是新生事物,所以法院暂时没有对这个问题做定性,希望给这个新兴的产业以一定的发展空间。而对于行业版权争议,专家提出可以适用著作权集体管理机制解决,由著作权集体管理组织统一授权,但目前在可操作性上还有待观察。
Tim反映版权问题中除了视频内容,还涉及声音权问题。对此,游云庭认为,视频内容在AI模型训练方面的版权问题,全球范围内还没有非常明确的法律法规,但声音权和肖像权问题在民法典中已有明确的法律法规,如朗诵其他句子使用了受训练音频中的人的声音特征,或生成了新的包含他人肖像特征的图片或视频,或类似Tim这种上传自己照片自动就生成拥有自己声音音色的视频内容,便是明确侵犯民法典他人声音权和肖像权的行为。