谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

来源:乐虎app 作者:作者 发布于:2020-09-05 10:00 分类:乐虎开户

 

投资者据此操作,风险自担。  如发现本站文章存在问题,提供版权疑问、身份证明、版权证明、联系方式等发邮件至news@。

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

当对包括文本摘要在内的下游NLP任务进行微调时,最近针对大型文本语料库进行自我学习的目标的预训练工作已显示出巨大的成功。

但是,尚未探讨为抽象文本摘要量身定制的预训练目标。 此外,缺乏跨不同领域的系统评估。 在这项工作中,我们提出了在大规模文本语料库上使用新的自我训练目标对基于大型编解码器模型进行预训练的方法。 在PEGASUS中,重要句子从输入文档中删除/掩盖,并作为其余句子的一个输出序列一起生成,类似于摘录摘要。

我们在涉及新闻,科学,故事,说明,电子邮件,专利和立法法案的12个下游汇总任务中评估了最佳PEGASUS模型。

实验表明,在通过ROUGE分数衡量的所有12个下游数据集上,它均达到了最先进的性能。 我们的模型还显示了在低资源汇总方面的令人惊讶的性能,超过了仅使用1000个学习后的6个数据集上的最新结果。 最后,我们使用人工评估验证了我们的结果,并表明我们的模型摘要可在多个数据集上实现人工表现。

项目地址:设定使用GPU在Google云端上创建实例(可选)请先创建一个项目并创建一个实例gcloudcomputeinstancescreate\${VM_NAME}\--zone=${ZONE}\--machine-type=n1-highmem-8\--acceleratortype=nvidia-tesla-v100,count=1\--boot-disk-size=500GB\--image-project=ml-images\--image-family=tf-1-15\--maintenance-policyTERMINATE--restart-on-failure安装库和依赖项在github上克隆库并安装要求。

gitclonehttps:///google-research/pegasuscdpegasusexportPYTHONPATH=.按照说明安装gsutil。

下载混合与动态模型的vocab,经过预训练和微调的检查点。

mkdirckptgsutilcp-rgs://pegasus_ckpt/ckpt/对下游数据集进行微调在现有数据集上对现有数据集进行微调aeslc。

python3pegasus/bin/=aeslc_transformer\--param_overrides=vocab_filename=ckpt/pegasus_ckpt/\--train_init_checkpoint=ckpt/pegasus_ckpt/\--model_dir=ckpt/pegasus_ckpt/aeslc评估经过微调的数据集。 python3pegasus/bin/=aeslc_transformer\--param_overrides=vocab_filename=ckpt/pegasus_ckpt/,batch_size=1,beam_size=5,beam_alpha=\--model_dir=ckpt/pegasus_ckpt/aeslc请注意,上面的示例使用的是单个GPU,因此batch_size远小于本文报告的结果。 添加新的微调数据集支持两种类型的数据集格式:TensorFlow数据集(TFDS)或TFRecords。

本教程说明如何在TFDS中添加新的数据集。

(希望对微调数据集进行监督,请supervised_keys在数据集信息中提供)。 Tfrecords格式要求每个记录都是的tf示例{"inputs":,"targets":}。

例如,如果您注册了一个new_tfds_dataset用于训练和评估的TFDS数据集,并且有一些文件名为tfrecord格式new_dataset_*用于测试,则可以在中注册它们/pegasus/params/public_。

@("new_params")defmy_param(param_overrides):returnpublic__params({"train_pattern":"tfds:new_tfds_dataset,train","dev_pattern":"tfds:new_tfds_dataset,validation","test_pattern":"tfrecord:new_dataset_*","max_input_len":512,"max_output_len":128,"train_steps":10000,"learning_rate":,"batch_size":8,},param_overrides)评估指标。 评估结果可在中找到mode_dir。 自动为每个评估点计算汇总指标。

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

中国科协党组书记、常务副主席、书记处第一书记怀进鹏,中国科协党组成员、书记处书记吕昭平参加会见。万钢代表中国科协对张国清一行的到访表示欢迎。他指出,在疫情防控形势下,天津克服困难、创新形式、精心组织,为筹备第四届世界智能大会做了大量卓有成效的工作,世界智能大会影响力和引领作用逐步增强,有效促进了产业竞争力的提升。

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

并且根据之前的爆料,荣耀30青春版在配色方面有幻夜黑、绿野仙踪、幻境银、夏日彩虹四种配色。虽然说距离7月2日还有时日,但是从这官方的海报中,就已经能够感受到荣耀30青春版那年轻的气息了。加上这个“5G青春,美好如你”的Slogan,可以说这款机型把现下的痛点都沾上了。(更多精彩内容,关注公众号(ID:yzcjapp),或者)理想汽车获亿美元D轮融资,王兴及美团已累计投资55亿元藕饼cp尹莉娜6月24日消息,据《晚点LatePost》报道,理想汽车即将获得亿美元D轮融资,其中美团领投5亿美元,理想汽车创始人李想跟投剩余5000万美元中的3000万,投后估值为亿美元。

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

谷歌开源项目飞马(PEGASUS):可以自动进行文章摘要

2019第十七届中国(上海)汽车电子技术论坛集结电子与整车行业强大力量,共同解读中国政府发展汽车电子与智能电子产业的核心要求,剖析技术与产业相关问题;2019第五届中国(上海)嵌入式系统安全论坛则将探讨开发和应用新一代嵌入式安全技术、构建安全的智联网系统等相关话题,为大家展示最新、最前瞻性的嵌入式个物联网安全技术、产品、解决方案等内容;5G与电子器件创新融合发展峰会聚焦当下行业热门话题,将围绕着5G产业重点展示关键元器件及设备,助力电子元器件行业把我发展机遇,实现跨越发展。  在科技发展与国际政策扶持的双重利好条件下,中国电子信息产业迎来了前所未有的良好发展时机,第94届中国电子展将以信息化带动工业化,电子技术促进产业升级为主题,聚焦行业前沿技术和创新产品,打造行业顶级信息交流和合作平台,是业内人士不可错过的行业盛会。


    上一篇:谷歌希望让你在搜索结果中直接安装App 下一篇:没有了
    Copyright © 乐虎app_乐虎app网址|直营平台 专业分析各种投稿,打造最大的乐虎app网站。