#author("2025-04-08T00:48:53+09:00","","")
#author("2025-04-08T00:49:59+09:00","","")
[[Smile:D]]

* MNIST (エムにスト) [#x67589e0]
人工知能学習者向けに無料で配布されている、機械学習に特化したデータセット。
60,000枚の訓練用画像と10,000枚の評価用画像が含まれる。

http://yann.lecun.com/exdb/mnist/

公式サイトは上記であるが、上記サイトからはダウンロード不可となっている。
(一時期認証画面が追加されたりし、その後ファイルが削除されている模様。)
(一時期認証画面が表示されていたが、現在は、ファイルが削除されている模様。)

以下に、ファイルを置いておく。

-[[t10k-images-idx3-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/t10k-images-idx3-ubyte.gz]]
-[[t10k-labels-idx1-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/t10k-labels-idx1-ubyte.gz]]
-[[train-images-idx3-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/train-images-idx3-ubyte.gz]]
-[[train-labels-idx1-ubyte.gz:https://ehobby.jp/~kei-n/files/mnist/train-labels-idx1-ubyte.gz]]

python で利用する場合は、下記の Numpy の ndarray バイナリファイルをダウンロードするのが良いかと思います。
-[[mnist.npz:https://ehobby.jp/~kei-n/files/mnist/mnist.npz]]

ロード方法は以下。
 import numpy as np
 
 npz = np.load("mnist.npz")
 print(f"学習用 画像データ: {npz['x_train'].shape}")
 print(f"学習用 正解の数値: {npz['y_train'].shape}")
 print(f"テスト用 画像データ: {npz['x_test'].shape}")
 print(f"テスト用 正解の数値: {npz['y_test'].shape}")
トップ   差分 バックアップ リロード   一覧 検索 最終更新   ヘルプ   最終更新のRSS