当前位置: 首页 > news >正文

苏州做网站专业的公司淘宝流量网站

苏州做网站专业的公司,淘宝流量网站,做视频素材网站,wordpress批量读取excel题目: 假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N > n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N 结论: 创建大…

 题目:

假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N >= n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N

结论:

创建大小为n的容器,先把前n个放进去,然后第i个(从n+1开始)有n/i的概率保留,随机和n个已保留的元素之一交换,有1-n/i的概率舍弃

证明:

1.数学归纳法:

        ①当N=n时,每个样本都选择概率都为n/N,显然成立。

        ②当N>n时,设k=N-1,则N=k+1,按照策略,前k个每个保留的概率为n/k(第k+1个元素未操作前),第k+1个保留的概率为n/(k+1),对于前k个任意一个元素,保留的概率:(n/k)*(((n/(k+1))*((n-1)/n)+(1-n/(k+1))=n/(k+1)=n/N,其实就是第k+1个保留且未换到该元素或者第k+1个未保留的概率×该元素原来保留的概率。

        ③所以当N>=n时,每个样本选择概率都为n/N。

 2.分类推理法:

        按照该策略,对于前n个元素,第i个(i>n)个元素后还保留的概率为(n/i)*((n-1)/n)+(i-n)/i=(i-1)/i

那么到第N个元素还保留的概率:1*(n/(n+1)*((n+1)/(n+2))*...*(N-1)/N=n/N

那么对于第i个元素(i>n)最后保留的概率,(n/i)*(i/(i+1)*...*(N-1)/N=n/N

所以对于所有元素,选择概率都为n/N

 代码实现:

 

import randomdef reservoir_sampling(stream, k):reservoir = []# 填充蓄水池,取前k个元素for i in range(k):reservoir.append(stream[i])# 对于第k个元素后的每个元素for i in range(k, len(stream)):# 随机生成一个数r,0 <= r < i+1r = random.randint(0, i)# 如果r小于k,则用当前元素替换蓄水池中的第r个元素if r < k:reservoir[r] = stream[i]return reservoirstream = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
k = 4
reservoir = reservoir_sampling(stream, k)
print(reservoir)  # 输出蓄水池中的抽样结果

http://www.fp688.cn/news/142203.html

相关文章:

  • 南京制作网站优化厦门零基础学seo
  • 闽侯福州网站建设seo查询爱站
  • 公司网站制作要百度网站优化软件
  • 成为网站有哪些网址?成都seo培训
  • 做招聘网站毕业设计秦皇岛seo招聘
  • 什么是网站原创文章站内营销推广方式
  • html做的网站怎么发布外包网站有哪些
  • 广州佛山建立网站的公司网站建站哪家公司好
  • 创建iis网站南京网站制作
  • iis 设置网站权限百度热搜关键词排名
  • wordpress会员收费权限青岛seo推广专员
  • 做木业网站怎样起名宁波网站推广网站优化
  • 网站公安备案号深圳市网络品牌推广
  • 核酸检测是否收费外汇seo公司
  • 餐厅网站建设文案书一般网站推广要多少钱
  • 德州专业网站开发公司什么是搜索引擎优化?
  • 龙泉市住房和城乡建设局网站网站首页制作
  • 西安网站建设求职简历网络营销sem培训
  • 一个商城网站多少钱百度认证证书
  • 项目网络计划图seo排名怎么样
  • 同城信息小程序源码防疫管控优化措施
  • 龙华品牌网站制作成都百度推广代理公司
  • 企业品牌网站建设报价域名服务器ip地址查询
  • 做网站带微好吗昆明自动seo
  • 短视频推广渠道合肥网站优化技术
  • wordpress网站地图插件友链交易网
  • 佛山网站建设在哪app开发工具哪个好
  • 网站建设赣icp苏州网站建设费用
  • 厚街镇做网站百度热搜榜排名今日
  • 自己做网站收费么网站seo外链建设