万象云档 本次搜索耗时 1.861 秒,为您找到 168 个相关结果.
  • 多进程的最佳实践

    多进程的最佳实践 共享 CUDA 向量 最佳实践和提示 避免和抵制死锁 重用经过队列的缓冲区 异步多进程训练 (例如 Hogwild) Hogwild 多进程的最佳实践 译者:@冯斐 校对者:@Twinkle torch.multiprocessing 是 Python 中 multiprocessing 模块的替代....
  • 2.2 寻找和为定值的两个数

    2.2 寻找和为定值的两个数 题目描述 分析与解法 解法一 解法二 解法三 解法总结 问题扩展 举一反三 2.2 寻找和为定值的两个数 题目描述 输入一个数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字。 要求时间复杂度是O(N)。如果有多对数字的和等于输入的数字,输出任意一对即可。 例如输入数组1、2、4、7...
  • 八、特征选择

    八、特征选择 用于特征选取的 ANOVA F 值 用于特征选择的卡方 丢弃高度相关的特征 递归特征消除 方差阈值二元特征 用于特征选择的方差阈值 八、特征选择 作者:Chris Albon 译者:飞龙 协议:CC BY-NC-SA 4.0 用于特征选取的 ANOVA F 值 如果特征是类别的,计算每个特征与目标向量之间的卡...
  • 2.2.2 预充电与激活

    图2.8并不完整,它只画出了访问DRAM的完整循环的一部分。在发送RAS信号之前,必须先把当前锁住的行置为非激活状态,并对新行进行预充电。在这里,我们主要讨论由于显式发送指令而触发以上行为的情况。协议本身作了一些改进,在某些情况下是可以省略这个步骤的,但预充电带来的时延还是会影响整个操作。 图2.9显示的是两次CAS信号的时序图。第一次的数据在CL周...
  • 2.2 DRAM访问细节

    在上文介绍DRAM的时候,我们已经看到DRAM芯片为了节约资源,对地址进行了复用。而且,访问DRAM单元是需要一些时间的,因为电容器的放电并不是瞬时的。此外,我们还看到,DRAM需要不停地刷新。在这一节里,我们将把这些因素拼合起来,看看它们是如何决定DRAM的访问过程。 我们将主要关注在当前的科技上,不会再去讨论异步DRAM以及它的各种变体。如果对它感兴...
  • 七、特征工程

    七、特征工程 稀疏特征矩阵上的降维 核 PCA 降维 使用 PCA 的降维 PCA 特征提取 使用 KMeans 聚类对观测分组 为 LDA 选择最佳数量的成分 为 TSVD 选择最佳数量的成分 将 LDA 用于降维 七、特征工程 作者:Chris Albon 译者:飞龙 协议:CC BY-NC-SA 4.0 稀疏特征...
  • Compound queries

    Compound queries Compound queries 复合查询用来包装其他复合或者叶子查询,一方面可综合其结果和分数,从而改变它的行为,另一方面可从查询切换到过滤器上下文。此类查询包含: constant_score 查询 这是一个包装其他查询的查询,并且在过滤器上下文中执行。与此查询匹配的所有文件都需要返回相同的“常量” _sco...
  • 并行和分布式训练

    并行和分布式训练 并行和分布式训练 PyTorch 分布式概述 单机模型并行最佳实践 分布式数据并行入门 用 PyTorch 编写分布式应用 分布式 RPC 框架入门 使用分布式 RPC 框架实现参数服务器 使用 RPC 的分布式管道并行化 使用异步执行实现批量 RPC 处理 将分布式DataParallel与分布式 RPC 框架相结...
  • 6.4 外排序

    6.4 外排序 方法介绍 问题实例 举一反三 6.4 外排序 方法介绍 所谓外排序,顾名思义,即是在内存外面的排序,因为当要处理的数据量很大,而不能一次装入内存时,此时只能放在读写较慢的外存储器(通常是硬盘)上。 外排序通常采用的是一种“排序-归并”的策略。 在排序阶段,先读入能放在内存中的数据量,将其排序输出到一个临时文件,依此进行,将...
  • 6.4 外排序

    6.4 外排序 方法介绍 问题实例 举一反三 6.4 外排序 方法介绍 所谓外排序,顾名思义,即是在内存外面的排序,因为当要处理的数据量很大,而不能一次装入内存时,此时只能放在读写较慢的外存储器(通常是硬盘)上。 外排序通常采用的是一种“排序-归并”的策略。 在排序阶段,先读入能放在内存中的数据量,将其排序输出到一个临时文件,依此进行,将...