本页

分词服务

POST /segment/urlclient.php

从分词服务获取分词的结果,返回的数据格式是JSON。

POST的参数列表:

参数 支持的值 说明
context 待分词的语句 必填,最大10K。
word_tag 0或者1 必填,是否返回词性
encoding GB18030、UTF-8、UCS-2 必填,传入的文件编码格式

输入参数示例:

$post_data = array();
$post_data['context'] = 'hi12';
$post_data['word_tag'] = 0;
$post_data['encoding'] = 'UTF-8';

返回参数示例:

[
    {"word":"hi","word_tag":"95","index":"0"},
    {"word":"12","word_tag":"90","index":"1"}
]

PHP SDK示例:

分词服务PHP SDK

词性列表

代码 词性说明
0 不知道
10 形容词
20 区别词
30 连词
31 体词连接
32 分句连接
40 副词
41 副词(“不”)
42 副词(“没”)
50 叹词
60 方位词
61 方位短语(处所词+方位词)
62 方位短语(名词+方位词“地上”)
63 方位短语(动词+方位词“取前”)
64 方位短语(动词+方位词“取前”)
70 前接成分
71 数词前缀(“数”—数十)
72 时间词前缀(“公元”“明永乐”)
73 姓氏
74 姓氏
80 后接成分
81 数词后缀(“来”–,十来个)
82 时间词后缀(“初”“末”“时”)
83 名词后缀(“们”)
84 处所词后缀(“苑”“里”)
85 状态词后缀(“然”)
86 状态词后缀(“然”)
87 状态词后缀(“然”)
90 数词
95 名词
96 人名(“毛泽东”)
97 机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”)
99 机构团体名(“北大”)
100 其他专名(“专”的声母的第1个字母为z,名词代码n和z并在一起。)
101 名处词
102 地名(名处词专指:“中国”)
103 n-m,数词开头的名词(三个学生)
104 n-rb,以区别词/代词开头的名词(该学校,该生)
107 拟声词
108 介词
110 量词
111 动量词(“趟”“遍”)
112 时间量词(“年”“月”“期”)
113 货币量词(“元”“美元”“英镑”)
120 代词
121 副词性代词(“怎么”)
122 数词性代词(“多少”)
123 名词性代词(“什么”“谁”)
124 处所词性代词(“哪儿”)
125 时间词性代词(“何时”)
126 谓词性代词(“怎么样”)
127 区别词性代词(“某”“每”)
130 处所词(取英语space的第1个字母。“东部”)
131 处所词(取英语space的第1个字母。“东部”)
132 时间词(取英语time的第1个字母)
140 助词
141 定语助词(“的”)
142 状语助词(“地”)
143 补语助词(“得”)
144 谓词后助词(“了、着、过”)
145 体词后助词(“等、等等”)
146 助词(“所”)
150 标点符号
151 顿号(“、”)
152 句号(“。”)
153 分句尾标点(“,”“;”)
154 搭配型标点左部
155 搭配型标点右部(“》”“]”“)”)
156 中缀型符号
160 语气词(取汉字“语”的声母。“吗”“吧”“啦”)
170 及物动词(取英语动词verb的第一个字母。)
171 不及物谓词(谓宾结构“剃头”)
172 动补结构动词(“取出”“放到”)
173 动词“是”
174 动词“有”
175 趋向动词(“来”“去”“进来”)
176 助动词(“应该”“能够”)
180 状态词(不及物动词,v-o、sp之外的不及物动词)
190 语素字
191 名词语素(“琥”)
192 动词语素(“酹”)
193 处所词语素(“中”“日”“美”)
194 时间词语素(“唐”“宋”“元”)
195 状态词语素(“伟”“芳”)
196 状态词语素(“伟”“芳”)
200 不及物谓词(主谓结构“腰酸”“头疼”)
201 数量短语(“叁个”)
202 代量短语(“这个”)
210 副形词(直接作状语的形容词)
211 名形词(具有名词功能的形容词)
212 副动词(直接作状语的动词)
213 名动词(指具有名词功能的动词)
230 空格