- 追加された行はこの色です。
- 削除された行はこの色です。
- AI/mnist へ行く。
#author("2025-04-08T00:48:53+09:00","","")
#author("2025-04-08T00:49:59+09:00","","")
[[Smile:D]]
* MNIST (エムにスト) [#x67589e0]
人工知能学習者向けに無料で配布されている、機械学習に特化したデータセット。
60,000枚の訓練用画像と10,000枚の評価用画像が含まれる。
http://yann.lecun.com/exdb/mnist/
公式サイトは上記であるが、上記サイトからはダウンロード不可となっている。
(一時期認証画面が追加されたりし、その後ファイルが削除されている模様。)
(一時期認証画面が表示されていたが、現在は、ファイルが削除されている模様。)
以下に、ファイルを置いておく。
-[[t10k-images-idx3-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/t10k-images-idx3-ubyte.gz]]
-[[t10k-labels-idx1-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/t10k-labels-idx1-ubyte.gz]]
-[[train-images-idx3-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/train-images-idx3-ubyte.gz]]
-[[train-labels-idx1-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/train-labels-idx1-ubyte.gz]]
python で利用する場合は、下記の Numpy の ndarray バイナリファイルをダウンロードするのが良いかと思います。
-[[mnist.npz:https://ehobby.jp/~kei-n/files/mnist/mnist.npz]]
ロード方法は以下。
import numpy as np
npz = np.load("mnist.npz")
print(f"学習用 画像データ: {npz['x_train'].shape}")
print(f"学習用 正解の数値: {npz['y_train'].shape}")
print(f"テスト用 画像データ: {npz['x_test'].shape}")
print(f"テスト用 正解の数値: {npz['y_test'].shape}")