当前位置: 首页 > news >正文

逸阳网站建设的目标站长工具百度百科

逸阳网站建设的目标,站长工具百度百科,wordpress 自己做页面,网站pc开发上海论文下载:https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章:ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。 不是对选择的token直接用mask替代,而是替换为…

论文下载:https://openreview.net/pdf?id=r1xMH1BtvB

另一篇分析文章:ELECTRA 详解 - 知乎

一、概述

对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。

不是对选择的token直接用mask替代,而是替换为一个生成器网络产生的token。

然后训练模型时并不是只被破坏的token,而是训练一个辨别模型来预测这些被破坏的输入的每一个token是否是被生成模型生成的样本替代的。因为将GANs应用于文本很困难,所以生成损坏token的生成器是以最大似然进行训练的。

小generator和大discriminator共同训练,但判别器的梯度不会传给生成器

fine-tuning 时丢弃generator,只使用discriminator

二、网络结构和训练

1、模型训练两个网络G和D。

        G:给定位置t,将该位置token替换为mask,输入到G,G输出一个概率,结合softmax层,来产生mask位置的xt,从而G产生损坏的输入。输出只在mask的token中计算分数,不是所有的token。

        D:给定位置t,D预测xt是否是真的。输出只在mask的token中预测是不是真的,不是所有的。

        对于给定一个随机位置序列,原始输入对应位置替换为[MASK] token,输入G,G学习恢复原始序列。D来分辨哪些token是被生成器产生的样本替换的。

文本损坏过程描述为:

2、损失函数为:

MLM损失的计算只计算m个,即m个被masked tokens

Disc损失 t的取值到 1..n,每个token都会更新参数

        在训练过程中,discriminator的loss不会反向传播到generator(因为generator的sampling的步骤导致),在pre-training之后,只使用discriminator进行fine-tuning.

http://www.fp688.cn/news/164957.html

相关文章:

  • 个人网站源码进一品资源百度手机助手下载安卓版
  • 给网站做翻译中国网站排名网
  • 国内电子商务网站有哪些互动营销是什么意思
  • 用哪个网站做首页比较好上海搜索引擎推广公司
  • 上行10m企业光纤做网站百度贴吧官网app下载
  • wordpress 读取pdf网络优化app
  • wordpress内容清空武汉seo关键词优化
  • 发布视频的平台大全免费手机优化大师下载安装
  • 建设一个企业网站下载手机百度最新版
  • 阿里云搭建公司网站怎么在百度上发布信息
  • 北京公司网站制作流程湖北百度推广电话
  • 网站开发面试推特最新消息今天
  • 网站名查询百度高级搜索
  • 如何搭建网站服务器保定百度首页优化
  • 大兴网站开发网站建设报价十大销售管理软件排行榜
  • 做空调管路网站桂林网站设计制作
  • 网站做自己的超链接sem是什么职业岗位
  • 深圳室内设计网百度推广seo
  • 广告建设网站建设佛山网站优化服务
  • 建设银行网站打不开免费b站软件推广网站
  • 网站策划书总结怎么找推广渠道
  • 凡科小程序教程网站更新seo
  • 网站tag标签功能实现google推广及广告优缺点
  • 简历表格 个人简历手机版泉州百度seo公司
  • 潍坊网站建设公司排名线下推广方式有哪些
  • 网站图片如何做防盗链郑州搜索引擎优化
  • 做的美食视频网站公司网站建站要多少钱
  • 医疗网站建设信息徐州seo代理计费
  • 食品经营许可证百度搜索引擎seo
  • 银行网站建设方案视频seo的基本工作内容