《重生学神有系统》转载请注明来源:错看小说网52cuokan.com
不过,在跑代码之前,还要对数据进行预处理。
江寒先从报名信息表中,将性别信息仍然“健在”的行挑出来,只保留序号、姓名和性别,另存为bel.xls。
这些记录一共9527条,大约占三万多条数据总数的30%。
它们对应着9527张真彩色照片。
24位真彩色的图片,每个像素点在内存里,要占用3个字节的存储单元。
每张照片有210×120个像素,这样读入一张照片,需要的内存空间就是210×120×3=75600个Byte。
9527条数据,共需要9527×75600=720241200B≈686.88M≈0.7G!
这个内存开销,还是比较容易接受的。
但是,“感知机”的算法,需要进行大量浮点乘法运算。
对每个像素的每个RGB分量都算一遍?
没那个必要,也太浪费时间。
所以,聪明的做法,是先把照片数据“压缩”一下。
江寒给“感知机”的代码,添加了一个LoadData函数,用来读取和处理照片数据。
在这个函数里,先定义一个二维的整形数组Feature。
然后从bel.xls中读出序号、姓名信息,按照刚才建立的索引表,找到对应的照片文件。
下一步,将照片读取到内存中,读取的同时,将每个像素二值化。
具体做法是:色彩浓度在阈值以上的像素,取值为1,低于阈值就让它为0。
这样一来,原本的真彩色照片,就被转换成了黑白轮廓图。
然后,再将轮廓图中的0或者1的取值,按照从左到右、从上到下的顺序,重新编排成一行数据,存放到数组Feature中。
Feature中的每一行,都存储了一张照片的二值化信息。
一共9527张照片,就需要9527行。
全部照片处理完毕后,就得到了一个巨大的二维数组Feature。
它有25200列、9527行。
接下来,定义一个拥有9527个整形元素的一维数组Label。
从bel.xls中读入性别信息,男生设为1,女生设为0,存放在数组Label中。
更多内容加载中...请稍候...
本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!