您如今的地位: 山西省乐赢师范附小流派网站 >> 西席园地 >> 保举材料 >> 注释
 
 

当代常用字部件及部件称号范例

作者:教诲部    西席园地泉源:本站原创    点击数:2292    更新工夫:2017/9/19

1 范畴

本尺度划定了信息处置惩罚中当代汉语词类及其他切分单元的标志代码。

实用于汉语信息处置惩罚,也可供当代汉语讲授与研讨参考。

2 术语和界说

下列术语和界说实用于本尺度。

2.1 汉语信息处置惩罚 Chinese Information ProcessingCIP

用盘算机对汉语形、音、义等信息举行输出、排序、存储、输入、统计、提取等。

2.2 切分单元 Segment Unit

汉语信息处置惩罚利用的、具有确定语法功效的基本单元。它包罗本尺度的规矩所限定的词、短语及其他单元。

2.3 词类 parts of speechPOS

词的语法分类,重要是凭据语法功效分别出来的类。

2.4 标志 Tag

对文本中切分单元的种别举行标注的代码。

3 总则

3.1 切分单元的范畴

本尺度的切分单元包罗词、短语和其他切分单元,如惯用语、缩略语、前接身分、后接身分、语素字、非语素字、标点标记、非汉字标记等。

3.2 词类分别的准绳

本尺度的词类分类体系参考了吕叔湘、朱德熙、胡裕树等老师的语法体系和《中学讲授语法体系提要》。

本尺度凭据汉语信息处置惩罚的特点和要求,重要根据语法功效准绳分别词类。

3.3 标志代码的订定准绳

根据国际通常做法,标志代码重要接纳英文术语的字母。比方,“名词”,接纳英文术语“noun”的首字母“n”作为标志代码;“数词”,接纳英文术语“numeral”的第三个字母“m”作为标志代码。

汉语独占的,或利用英文术语字母未便的,根据海内通常做法,标志代码接纳汉语拼音字母。如,“缩略语”,接纳汉字“简”汉语拼音的首字母“j”作为标志代码;“语素字”,接纳汉字“根”汉语拼音的首字母“g”作为标志代码。

4 词类及其他切分单元分类

本尺度将词类分别为13个一级类,16个二级类;其他切分单元分别为7个一级类,13个二级类。用户可凭据必要自行补充。

4.1 词类分别及标志代码

4.1.1 名词(n),表现人或事物的称号,在句子中重要充任主语和宾语。

4.1.1.1 平凡名词(ng),表现事物的称号。如:

人马 书 西席 飞机 电冰箱 姨妈 桌子 木头

品德实际 历史 头脑 文明 要素 作风 哲学

4.1.1.2 工夫名词(nt),包罗一样平常所说的时量词。如:

年代日 分 秒

如今已往昨天 客岁 未来 宋朝 星期一

4.1.1.3 方位名词(nd),表现地位的绝对偏向。如:

上下左 右 前 后 里 外 中 东 西 南 北

前边左面外头 中心 内部

4.1.1.4 地方名词(nl),表现地方。如:

空中高处 隔邻 门口 相近 内地 一旁 田野

4.1.1.5 人名(nh),表现人的称号的专著名词。

华罗庚阿凡提 诸葛亮 司马相如 松赞干布 卡尔·马克思

4.1.1.6 地名(ns),表现天文地区称号的专著名词。如:

亚洲 大泰西 地中海 阿尔卑斯山 加拿大

中国 北京 浙江 景德镇 呼和浩特 中关村

4.1.1.7 族名(nn),表现民族或部落称号的专著名词。如:

回族 藏族 壮族 蒙古族 维吾尔族 哈萨克族

4.1.1.8 机构名(ni),表现集团、构造、机构称号的专著名词。如:

团结国 教诲部 北京大学 中国迷信院

4.1.1.9 其他专著名词(nz)。如:

五粮液宫爆鸡丁 桑塔纳

4.1.2 动词(v),表现行动、举动,生理运动、生理形态及事物的存现、变革等,在句子中重要充任谓语。

4.1.2.1 及物动词(vt),可以或许带宾语。如:

吃打擦 洗 喂 借 送 买 捧 提 填

喜好报告担当 倾慕 思量 观察 赞同 发起

4.1.2.2 不及物动词(vi),不克不及够带宾语。如:

病苏息 咳嗽 瘫痪 游泳 睡觉

4.1.2.3 接洽动词(vl),表现干系的果断。如:

4.1.2.4 能愿动词(vu),表现大概、志愿。如:

可以或许能 应该 可以 大概 甘心 乐意 要

4.1.2.5 趋势动词(vd),表现趋势。如:

(走)上(趴)下(进)来 (回)去

(跑)下去(失)下去(提)起来 (扔)已往

4.1.3 描述词(a),表现性子、形态,在句中重要充任谓语、定语、状语和补语。

4.1.3.1 性子描述词(aq),表现性子。如:

好高 美 大 大胆 伤害 英俊 洁净 巨大

4.1.3.2 形态描述词(as),表现形态。如:

洁白黢黑 通红 冰冷 绿油油 黑糊糊 白花花 冷冰冰

4.1.4 区别词(f),表现事物的区别性特性,在句子中只能做定语修饰名词或跟助词“的”构成“的”字布局。如:

男女 公 母 雌 雄 微型 国产 军用

4.1.5 数词(m),表现数量和序次。如:

零一半 百 千 百万 一百零八

第一第十八

4.1.6 量词(q),表现人、事物或行动的单元。如:

个 条 片 匹 辆 尺 斤 两 吨 支 回 次 遍 千瓦时

4.1.7 代词(r),起替换和复指作用。如:

我你 他 这 那 谁 我们 你们 他们

这个谁人 各人 本身 什么 那边 怎样 怎样样

4.1.8 副词(d),修饰或限定动词和描述词,表现范畴、水平等。在句子中做状语。如:

都只就 仅 很 再三 频频 将 不 却

统共正在每每 重新 已经 居然 竟然

4.1.9 介词(p),引介名词性身分,不但独充任句子身分。如:

把 被 从 向 对 凭

根据 对付 为了 自从 关于

4.1.10 连词(c),毗连词、短语或句子,表现两者之间所具有的某种干系。如:

和同与 及 并 或

而且并且大概 由于 以是

4.1.11 助词(u),附着在词、短语、句子背面表现某种附加意义。如:

的地 得 了 着 过 等等 似的 一样

4.1.12 叹词(e),表现叹息、召唤或应对,可独立成句或在句中充任独立身分。如:

啊嗯 唉 哎 哼 哦 哎哟 哎呀

4.1.13 拟声词(o),模仿天然界事物的某种声响,不克不及独自成句。如:

砰滴答 扑通 咕咚 丁丁当当

4.2 其他切分单元分别及标志代码

4.2.1 惯用语(i),一种相沿惯用的定型短语。

4.2.1.1 名词性惯用语(in)。如:

梦幻泡影 坐井观天 蛛丝马迹

4.2.1.2 动词性惯用语(iv)。如:

跑龙套 打官腔 吃成本 与时俱进 励精图治

4.2.1.3 描述词性惯用语(ia)。如:

富厚多彩 勤勤俭俭 大公至正

4.2.1.4 连词性惯用语(ic)。如:

总而言之 由此可见 综上所述

4.2.2 缩略语(j),专著名词或常用语的简缩情势。

4.2.2.1 名词性缩略语(jn)。如:

人大 五四 奥运

4.2.2.2 动词性缩略语(jv)。如:

调研 离退休

4.2.2.3 描述词性缩略语(ja)。如:

短平快 高精尖

4.2.3 前接身分(h),词根后面的附加构词身分。如:

阿 老 初 第

4.2.4 后接身分(k),词根背面的附加构词身分。如:

子 儿 头 化 们 式 性 者

4.2.5 语素字(g),汉字字符会合一样平常不但独利用的汉字。

4.2.5.1 名词性语素字(gn)。如:

民 农 材

4.2.5.2 动词性语素字(gv)。如:

抒 究 涤

4.2.5.3 描述词性语素字(ga)。如:

殊 遥 伟

4.2.6 非语素字(x),汉字字符会合独自利用时不具故意义的汉字,如:

垃 琵 蜘 踌 鸯 蜻

4.2.7 其他 (w

4.2.7.1 标点标记(wp),如:

,。 、 ; ? ! : “” ……

4.2.7.2 非汉字字符串(ws),如:

office windows

4.2.7.3 其他未知的标记(wu)。

5 词类及其他切分单元标志代码表(略)


西席园地录入:admin    责任编辑:admin 
  • 上一篇西席园地:

  • 下一篇西席园地:
  • 网友批评:(只表现最新10条。批评内容只代表网友看法,与本站态度有关!) 【颁发批评】【参加珍藏】【报告挚友】【打印此文】【封闭窗口

    Copyright 2006-2012 山西省乐赢师范隶属小学 All Rights Reserved