![]()
6165con登录平台 8月8日信息:Prosecraft.io 是一个网站,它使用小说来支撑一个以数据驱动的项目,用于显露字数、被动语态和其他更加主观的写作风格标记,譬如生动性。 但在编辑们抗议这个项目之后,Prosecraft 今日关闭了。Prosecraft 使用超过 25,000 本书的全部文本——这都是受版权保护的材料——以便开发一个数据库。编辑们知道了这个项目,马上对此表示了强烈的不满。 Zach Rosenberg 是第一个在 X(已往被称为 Twitter)网站上触发编辑们广泛关注的人。很快,越来越多的编辑开始发声,其中囊括高知名度的编辑,打个比方 Jeff VanderMeer(《The Southern Reachtrilogy》),Indra Das(《The Devourers》),Gretchen Felker-Martin(《Manhunt》)。 期间就有分原因是 Prosecraft 承认使用了「人工智能算法」。在 2023 年 10 月 5 日的一篇博客文章中,Prosecraft 和基于 Prosecraft 库挖掘出来的数据构建的写作程序 Shaxpir 的开发者 Benji Smith 表态,「大家教会了大家的机器学习 [AI] 算法辩识哪些词汇允许在哪些上下文中使用,通过调查在类似的句子和段落中出现的词汇和短语的类型。」此外,他写道,Shaxpir「分析了来自 3300 多位知名编辑撰写的 580 多万字的小说。」他没有透露本身从哪里获得这些小说,也没有透露是否获得了许可。 虽然使用的技术并不一定是像 ChatGPT 那样的大型语言生成模型,但可以说,将生成的 LLM 算法纳入 Prosecraft 的规划是有能够的。而且由于该网站有远大的图书库,编辑们的顾忌是完全合理的。在此次抗议以后,Smith 在 Medium 上写了一篇长篇博客,说明了为什么他自愿关闭了 Prosecraft。 即使 Prosecraft 只使用了文本的一部分,但它并没有得到任何编辑或出版商的许可来成立基于编辑全部作品或整本书的数据库。Smith 在博客上写道,「由于我只发表了摘要统计数据和从这些书中提取的小段落,我认准我敬重了公平使用原则的精神,这并不需要原始编辑的同意。」 虽说这个观点有些道理,但公平使用并不可以你在没有获得许可的情况下使用编辑的整本受版权保护的作品,看成一个效应在你自身的「AI 算法」上的数据训练程序的一部分。虽然这种情况铁定会给很多人上一课,但很明显,编辑们不会允许他们的作品被用来训练 LLM 和矢量网络。 最终,在一篇网罗数十段文章的最终几段中,Smith 说「我听到了你们的阻挡意见,我期待你们能接受我最诚挚的歉意。」他在帖子的最后表示,他希望有一天「在编辑和出版商的同意下重建这个项目」,社交媒体上的作家认为这暗示着他实际上并没有删除他的图书数据库,这意味着数据还是允许倘或允许用来训练人工智能程序,以制作出与真实作家具有同样字数和「生动性」的虚假书籍。 (举报) AI正版系统源码推荐:小狐狸GPT-AI付费创作系统+对接大陆各大接口 (责任编辑:admin) |