智能拼音输入法系统的设计与实现(附答辩记录)
无需注册登录,支付后按照提示操作即可获取该资料.
智能拼音输入法系统的设计与实现(附答辩记录)(包含选题审批表,任务书,开题报告,中期检查报告,毕业论文16000字,答辩记录,程序代码)
摘 要:汉字输入法研究是自然语言处理的一个重要课题。由于输入法编程不同于一般的程序设计,属于系统级的多语言支持组件,按照系统定义的多语言支持的核心组件之一的IMM-IME(输入法管理器-输入法编辑器)结构规范制作软件是最好的选择。它将为为输入法的开发提供强有力的支持。IME提供了两个界面,其一为用户界面,它可以把用户输入显示在显示器上。另外一个是转换界面,它能够把输入转换成汉字。因此需要对IME用户界面的进行设计和对输入编码到汉字字符的转换工作的编程。
文中在实现输入法的同时,对实现输入法必须掌握的输入法管理器-输入法编辑器(IMM-IME)结构、工作过程,及具体实现步骤进行综述。并且详细讨论字典、词典的构成,装载,卸载。拼音分析、分割,转化成汉字的详细过程。
关键词:汉字输入法; 自然语言处理; 拼音输入法;IMM-IME;
Design and Realiztion of Intelligent Pinyin Inputing Method System
Abstract: Chinese characters input method is an important issue of natural language processing. Because the programing of input method is different from common programing. The software of input method is a component belonging to multilingual support operating system level. So using IMM-IME architecture, which is one of the core components, supporting multilingual and defined by OS(windows), is the best choice. It will provide great support to input method programing . IME provide two components. One is the IME user interface which can display what we input on the screen. The other is the IME conversion interface which can convert input keyboard characters into Chinese characters. Therefore,need designing the IME user interface and programing that converting input keyboard characters into Chinese characters.
While implementation of input method programing in this paper, summarizes IMM - IME architecture , work procedure and implementation steps , which must be mastered while accomplishing Chinese characters input method. In addition,introduces architecture, loading and uninstall of two dictionaries. One is for Chinese characters and the other is for Chinese phrases. Analysing,segmentation of Pin-yin(characters of Chinese spelling) and conversion from Pin-yin to Chinese phrases will be introduced. Unique programing will be mentioned also.
Key words: Chinese input method ; Natural language processing ; Chinese Pinyin input method ;IMM-IME
选题背景
输入法就是在有限的键盘上,用尽可能少的输入,快速准确的输出字词的一套方法。那么中文拼音输入法,就是以拼音规则作为输入,输出汉字的一套方法。其实在“输入法”后面省略了“软件”两个字。也就是它还是一种程序。当然,本文研究的是键盘输入法。另外还有语音输入法,笔输入法。如果没有特殊指出。本文的“输入法”都默认为键盘输入法。
输入法的分类
只有分类分析,才能有一种大局观。虽然输入法种类繁多。但是归纳以后,发展目的十分清晰,并符合发展的规律。
(1)特征信息元分类法
最常见的分类法是按编码时使用的特征信息元(或称字元)将汉字编码输入法分为音码、形码、音形码和形音码。音码又可以细分为全拼码(也就是这篇文章使用的)、双拼码、简拼码。形码又可以细分为部件码和笔画码。部件码需要将汉字拆分为部件或字根,再将它们通过音托、位托、形托等方式映射到键盘字符。音形码以音为主以形为辅。形音码以形为主以音为辅。
(1)其他分类法
另外,按处理对象大小来分,汉字编码输入法有单字型、字词型(介绍的软件可以达到的类型)和语句型,难度逐级成指数增加;按适用的输入者来分,汉字编码输入法可以分为普及型与专业型;按编码时使用的码元字符来分,汉字编码输入法可以分为字母码和数字码;按软件的适应性来分,汉字编码输入法可以分为通用输入法平台(又称码表输入法)和专用输入法(或称定制输入法);按使用的键盘来分,汉字编码输入法可以分为通用键盘输入法和数字键盘输入法。