Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略


服饰温婉
服饰温婉 2022-09-19 15:31:07 50915
分类专栏: 资讯

Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略

目录

Handwritten Digits数据集的简介

Handwritten Digits数据集的安装

Handwritten Digits数据集的使用方法


 

Handwritten Digits数据集的简介

       根据官方对数据集的描述,我们可以知道完整的手写体数字图像分为两个数据集合。其中,训练数据样本3823条,测试数据1797条,图像数据通过8X8的像素矩阵表示,共有64个像素维度。1个目标维度用来标记每个图像样本代表的数字类别。该数据没有缺失的特征值,并且不论是训练还是测试样本.在数字类别方面都采样得非常平均,是一份非常规整的数据集。

       We used preprocessing programs made available by NIST to extract normalized bitmaps of handwritten digits from a preprinted form. From  a total of 43 people, 30 contributed to the training set and different  13 to the test set. 32x32 bitmaps are divided into nonoverlapping   blocks of 4x4 and the number of on pixels are counted in each block.  This generates an input matrix of 8x8 where each element is an   integer in the range 0..16. This reduces dimensionality and gives   invariance to small distortions.

       我们使用NIST提供的预处理程序从预先打印的表单中提取手写数字的标准化位图。共有43人参加,其中30人参加了train,13人参加了test。32x32位图分为不重叠的4x4块,每个块中的像素数都计算在内。这将生成8x8的输入矩阵,其中每个元素都是0到16之间的整数。这减少了维数,并使小变形不变性。

Number of Instances:   optdigits.tra Training 3823  optdigits.tes Testing  1797    The way we used the dataset was to use half of training for   actual training, one-fourth for validation and one-fourth  for writer-dependent testing. The test set was used for   writer-independent testing and is the actual quality measure.

optdigits.tra  训练3823份+测试1797份。我们使用数据集的方法是将一半的训练用于实际训练,四分之一用于验证,四分之一用于依赖作者的测试。测试集用于独立于作者的测试,是实际的质量度量。

属性数64输入+1类属性7。对于每个属性:所有输入属性都是0到16范围内的整数。最后一个属性是类代码0..9 8。缺少属性值无

内容转载自:Optical Recognition of Handwritten Digits

  1. 9. Class Distribution
  2. Class: No of examples in training set
  3. 0: 376
  4. 1: 389
  5. 2: 380
  6. 3: 389
  7. 4: 387
  8. 5: 376
  9. 6: 377
  10. 7: 387
  11. 8: 380
  12. 9: 382
  13. Class: No of examples in testing set
  14. 0: 178
  15. 1: 182
  16. 2: 177
  17. 3: 183
  18. 4: 181
  19. 5: 182
  20. 6: 181
  21. 7: 179
  22. 8: 174

Handwritten Digits数据集的安装

点击对应数据文件即可下载!

数据集下载:https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/
训练集网址:https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tra
 

Handwritten Digits数据集的使用方法

  1. Two versions of this database available.
  2. 1) Preprocessed data can be found in optdigits.tra and optdigits.tes
  3. See optdigits.names for information regarding the preprocessing.
  4. 2) The original format of the data can be found in files prefixed with
  5. optdigits-orig.
  6. Cathy Blake
  7. Sept 3,1998

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=3297
赞同 0
评论 0 条
服饰温婉L0
粉丝 0 发表 6 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2691
【软件正版化】软件正版化工作要点  2655
统信UOS试玩黑神话:悟空  2559
信刻光盘安全隔离与信息交换系统  2247
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1117
grub引导程序无法找到指定设备和分区  769
江波龙2025届校园招聘宣讲会行程大放送  28
点击报名 | 京东2025校招进校行程预告  25
海康威视2025校招|海康机器人,邀你共创工业智能化未来!  24
金山办公2024算法挑战赛 | 报名截止日期更新  22
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!