※ 引述《z115988 (Lee)》之铭言:
: 目前还只是对tensorflow似懂非懂状态
: 借此篇想延伸发问一下
: : 比方说我想要辨识一张椅子,我想要知道的就只有他是椅子的机率。
: : 当我测试图片为一张椅子时,他就跟我说这是一张椅子。
: : 当我测试图片为其他东西(比方说一个人或一个水壶)的时候,他就跟我说这不是一张椅子
: : 。
: : 请问这样子模型要如何训练呢?爬了许多文找不到相关的讨论,恳请各位给我关键字。谢
: : 谢!
: 由tensorflow网站看到CNN教学是以MNIST为范例
: 这似乎是把一群资料压缩成一种档案(格式?)
: 于是我想尝试把我的资料集套用在此范例的CNN来玩看看
: (假设我的资料与范例一样是二维的)
: 不知道普遍上资料集格式大家都是怎样做的?
: 我的认知是
: 1.应该会有人使用一张一张图片放进去读
: 2.也有人像范例一样制作成一个档案进行读取
: 这两种方法优劣如何?
: 想请问前辈这两种的详细作法是如何
: 或是有那些文章可以参考
tensorflow 的范例里面 MNIST 资料处理有包括 download dataset, extract images,
extract labels, 对 label 作 one-hot-encoding, 处理 batch ...
你如果要处理自己的档案,可以参考 tensorflow input pipeline
https://www.tensorflow.org/api_guides/python/reading_data
另外,training 的时候,都会使用 batch 方式去 train model,不会一笔资料一
笔资料去 train (除非使用 batch 的时候,memory 不够)。batch 处理速度会快很
多,通常效果也可能好一些。
如果只是要做简单的 model,你也可以使用 Keras,会精简很多