【资料图】

据艾伦AI研究所(AI2)官方博客,8月19日,艾伦AI研究所发布了包含3万亿个token(词例)的开放语料库。据悉,这些语料来自各种网络内容、学术出版物、代码、书籍和百科全书等材料,是迄今为止最大的开放文本数据集。

推荐内容