技术教育社区
www.teccses.org

中文印刷体文档识别技术-(含光盘)

封面

作者:王科俊,冯伟兴著

页数:203

出版社:科学出版社

出版日期:2010

ISBN:9787030287601

电子书格式:pdf/epub/txt

内容简介

本书全面阐述了中文印刷体文档识别的原理、方法和系统组成。依据中文印刷体文档的特点,分别介绍了文档图像预处理、版面分析、汉字识别、公式的定位与提取、公式字符分割与识别、公式结构分析与表示、图表处理等内容的基本原理和技术实现方法,并提供了一个中文印刷体文档识别系统实例。
本书可作为研究公式识别、表格识别和汉字识别技术的参考书,可供从事图像处理、文字识别的研究人员阅读,也可作为计算机、信息工程、电子技术、自动化等相关学科专业的研究生和高年级本科生学习图像处理、模式识别技术的辅助教材参考使用。
本书还配有完整的实例代码光盘,供读者参考。

相关资料

插图:信息化理念已经被很多人所熟悉,人们越来越追求一种有力的、简洁的、准确无误的信息交流手段。由于人们日常生活中接收到的绝大多数信息是以图像的形式进行传递的,尤其是依托互联网的数字图书馆和远程教育的兴起,使得图像信息自动识别技术有着广泛的应用前景和重要的研究价值。中文印刷体文档识别技术就是一个典型的针对含有中文字符图像的信息自动识别技术。1.1 中文印刷体文档识别基本原理现有的文字识别技术一般采用光学的方式将文字图像信息采集到计算机中,因此,该类技术常被称为光学字符识别(optiCal character recognition,OCR)技术。经过近一个世纪的发展,OCR已经成为当今模式识别领域中最活跃的研究内容之一。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并在计算机及其相关领域中得到了广泛应用。按照识别方法,OCR识别方法可以分为如下三类:统计特征字符识别技术、结构特征字符识别技术和基于人工神经网络的字符识别技术。作为OCR技术的一个重要研究方向,印刷体文档识别主要针对比较正式、规范的书籍、报刊和杂志的图像信息进行采集和识别。与一般文档图像相比,印刷体文档图像存在前景信息与背景信息色差显著,文字信息形式规范等特点,这都为印刷体文档的信息处理和识别创造了便利条件。然而,各类印刷体文档中除了包含文字信息以外,还常有公式、表格以及各种各样的图形等信息,因此,若将印刷体文档中包含的所有信息都完整地识别出来,也不是一件易事。

本书特色

《中文印刷体文档识别技术》:智能科学技术著作丛书

目录

《智能科学技术著作丛书》序
前言
第1章 绪论
1.1 中文印刷体文档识别基本原理
1.2 中文印刷体文档识别研究现状
1.2.1 印刷体文档的汉字识别
1.2.2 印刷体文档的公式识别
1.2.3 印刷体文档的表格识别
1.3 中文印刷体文档识别中的难点
第2章 中文印刷体文档图像预处理
2.1 中文印刷体文档图像采集
2.1.1 文档图像采集
2.1.2 文档图像显示
2.1.3 文档图像格式
2.2 中文印刷体文档图像特点

节选

《中文印刷体文档识别技术》全面阐述了中文印刷体文档识别的原理、方法和系统组成,依据中文印刷体文档的特点,分别介绍了文档图像预处理、版面分析、汉字识别、公式的定位与提取、公式字符分割与识别、公式结构分析与表示、图表处理等内容的基本原理和技术实现方法,并提供了一个中文印刷体文档识别系统实例。《中文印刷体文档识别技术》可作为研究公式识别、表格识别和汉字识别技术的参考书,可供从事图像处理、文字识别的研究人员阅读,也可作为计算机、信息工程、电子技术、自动化等相关学科专业的研究生和高年级本科生学习图像处理、模式识别技术的辅助教材参考使用.《中文印刷体文档识别技术》还配有完整的实例代码光盘,供读者参考。

下载地址

立即下载

(解压密码:www.teccses.org)

Article Title:《中文印刷体文档识别技术-(含光盘)》
Article link:https://www.teccses.org/183922.html