论文标题

mnist-mix:多语言手写数字识别数据集

MNIST-MIX: A Multi-language Handwritten Digit Recognition Dataset

论文作者

Jiang, Weiwei

论文摘要

在这封信中,我们贡献了一个名为MNIST-MIX的多语言手写数字识别数据集,该数据集是语言和数据示例的最大类型的最大数据集。使用MNIST具有相同的数据格式,可以在现有研究中无缝应用MNIST-MIX进行手写数字识别。通过引入10种不同语言的数字,MNIST-MIX成为一个更具挑战性的数据集,其不平衡分类需要更好的模型设计。我们还提出了应用LENET模型的结果,该模型已在MNIST上预先训练为基线。

In this letter, we contribute a multi-language handwritten digit recognition dataset named MNIST-MIX, which is the largest dataset of the same type in terms of both languages and data samples. With the same data format with MNIST, MNIST-MIX can be seamlessly applied in existing studies for handwritten digit recognition. By introducing digits from 10 different languages, MNIST-MIX becomes a more challenging dataset and its imbalanced classification requires a better design of models. We also present the results of applying a LeNet model which is pre-trained on MNIST as the baseline.

扫码加入交流群

加入微信交流群

微信交流群二维码

扫码加入学术交流群,获取更多资源