扫描仪(scanner),是利用光电技术和数字处理技术,以扫描方式将图形或图像信息转换为数字信号的装置。
扫描仪通常被用于计算机外部仪器设备,通过捕获图像并将之转换成计算机可以显示、编辑、存储和输出的数字化输入设备。扫描仪对照片、文本页面、图纸、美术图画、照相底片、菲林软片,甚至纺织品、标牌面板、印制板样品等三维对象都可作为扫描对象,提取和将原始的线条、图形、文字、照片、平面实物转换成可以编辑及加入文件中的装置。扫描仪中属于计算机辅助设计(CAD)中的输入系统,通过计算机软件和计算机,输出设备(激光打印机、激光绘图机)接口,组成网印前计算机处理系统,而适用于办公自动化(OA),广泛应用在标牌面板、印制板、印刷行业等。
扫描仪可分为三大类型:滚筒式扫描仪和平面扫描仪,近几年才有的笔式扫描仪、便携式扫描仪、馈纸式扫描仪、胶片扫描仪、底片扫描仪和名片扫描仪。
折叠笔式
笔式扫描仪出现于2000年左右,才开始的扫描宽度大约只有四号汉字相同,使用时,贴在纸上一行一行的扫描,主要用于文字识别。
折叠便携式
便携式扫描仪小巧、快速,在2010,市面上出现了多款全新概念的扫描仪,因其扫描效果,扫描速度仅需1秒,价格也适中,扫描仪体积非常小巧而受到广大企事业办公人群的热爱。
扫描仪的工作原理如下: 自然界的每一种物体都会吸收特定的光波,而没被吸收的光波就会反射出去。扫描仪就是利用上述原理来完成对稿件的读取的。扫描仪工作时发出的强光照射在稿件上,没有被吸收的光线将被反射到光学感应器上。光感应器接收到这些信号后,将这些信号传送到模数(A/D)转换器,模数转换器再将其转换成计算机能读取的信号,然后通过驱动程序转换成显示器上能看到的正确图像。待扫描的稿件通常可分为:反射稿和透射稿。前者泛指一般的不透明文件,如报刊、杂志等,后者包括幻灯片(正片)或底片(负片)。如果经常需要扫描透射稿,就选择具有光罩(光板)功能的扫描仪。
扫描仪的核心部件是光学读取装置和模数(A/D)转换器。常用的光学读取装置有两种:CCD和CIS。
① CCD(Charge Coupled Device)
CCD的中文名称是电荷耦合器件,与一般的半导体集成电路相似,它在一块硅单晶上集成了成千上万个光电三极管,这些光电三极管分成三列,分别被红、绿、蓝色的滤色镜罩住,从而实现彩色扫描。光电三极管在受到光线照射时可产生电流,经放大后输出。采用CCD的扫描仪技术经多年的发展已相当成熟,是市场上主流扫描仪主要采用的感光元件。
CIS的中文名称是接触式图像感应装置。它采用触点式感光元件(光敏传感器)进行感光,在扫描平台下1mm~2mm处,300~600个红、绿、蓝三色LED(发光二极管)传感器紧紧排列在一起,产生白色光源,取代了CCD扫描仪中的CCD阵列、透镜、荧光管和冷阴极射线管等复杂机构,把CCD扫描仪的光、机、电一体变成CIS扫描仪的机、电一体。用CIS技术制作的扫描仪具有体积小、重量轻、生产成本低等优点,但CIS技术也有不足之处,主要是用CIS不能做成高分辨率的扫描仪,扫描速度也比较慢。
光学字符识别OCR(Optic Character Recognize)技术
OCR技术是在扫描技术的基础上实现字符的自动识别。在获得纸面上反射光信号后,由OCR内部电路识别出字符,并将字符代码输入到计算机中。
预处理包括文字分离、正规化、平滑化、二值化和噪声消除等。预处理的方法是将字符逐个分开,规范成大小一致的图像,经特殊处理和消除噪声,为后续处理创造条件。
如果被识别的是正规的铅印字符,一般可利用与基准图像重合比较的方法来识别字符,不必抽取字符图像中的特征。若是手写字符,则需利用轮廓跟踪法抽取相应的字符特征。抽取的特征是识别的依据,如笔划的长度、角度、端点、笔划分布、四周特征等,它们以多维数据的形式表示。作为识别标准的学习图形,也以多维矢量的形式存放在识别辞典中。
所谓判决就是将事先保存的基准字符特征与抽取的字符特征进行比较,直至找到相应的基准字符为止。
OCR技术在识别数字、英文字符及印刷体汉字方面已获得成功。
除了键盘、鼠标器、扫描仪之外,还有触摸屏、声音识别器等输入设备,在此就不作介绍了。