语料内容过滤方面,应采取关键词、分类模型(应完整覆盖附录a中全部31种安全风险)、人工抽检等方式,过滤不良信息。
知识产权方面,应设置知识产权负责人,建立知识产权管理策略。
tip
由于知识产权较复杂,建议在建立知识产权管理策略时明确阐述流程,且应有法务参加相关策略的制定。
对知识产权侵权情况进行识别,发现存在知识产权侵权等问题的,fuwu提供者不应使用相关语料进行训练。识别的主语删除知识产权相关负责人,示例删除商业秘密、商标权、专利权的内容。
应建立知识产权问题的投诉jubao渠道,删除处理渠道。
应在用户fuwu协议中,告知知识产权风险,约定问题识别的责任与义务。实践中已有知识产权侵权相关判例。
应及时更新知识产权相关策略。
国际上还包含以下措施,并不强制:公开训练语料中涉及知识产权部分的摘要信息,在投诉jubao渠道中支持第三方就语料使用情况以及相关知识产权情况进行查询。
在使用包含个人信息的语料前,应取得对应个人同意或者符合法律、行政法规规定的其他情形。
在使用包含敏感个人信息的语料前,应取得对应个人单独同意或者符合法律、行政法规规定的其他情形。
本次修订删除使用包含人脸等生物特征信息作为语料的场景。