分析视角:

1、语言学的视角:可以采用汉字切分系统,对语料进行词的切分和标注。

2、话语分析的角度:研究要回答什么问题并且要达到什么目的。

3、语用的角度:满足友好原则、合作原则、面子原则等。

4、心理学视角:分析了解他人的内心想法,才能更好的了解如何回答他人所提出的问题。

5、社会学视角:了解社会发现的趋势和潮流,了解人们普遍的思想模式,通过此来分析所说的语言。

如何做语料分析

短信出现的时间在新的一年即将到来之际。学生首先发信。

学生:您好,孔老师!元旦后还上课吗?其他老师到时都结课了.论文是下周交吗

学生:研一论语学一班的同学

老师:我会按原定计划结课.

老师:下周上课就会知道.

学生:方便现提前告知吗?因为元旦要离开南京,明天得同时去买好返乘票

老师:该买就买.

学生:抱歉,还是没弄明白.只是您的课不知是否结束了,其他课元旦后就放假不上了.如果论语学业不上.明天我就可以买晚几天的返程票.

老师:我会像其他老师一样结课.

--------完--------

分析视角:1)语言学视角;2)话语分析视角;3)语用学视角;4)心理学视角;5)社会学视角;6)其他视角

1)语言学视角

可以采用汉字切分系统(如ICTCLAS),对语料进行词的切分和标注。切分结果示例:学生:您/r好/a,/w 孔/n 老师/n !/w 元旦/t 后/f 还/d 上/v 课/n 吗/y ?/w 其他/r 老师/n 到/v

时//n都/d 结/v 课/n 了/y ./w 论文/n 是/v 下/f 周/n 交/v 吗/y

然后统计分析各种词性的词使用的情况。

2)话语分析的角度

分析与回答:先是学生,最后是老师。

3)语用的角度(友好原则、合作原则、面子原则等等)

语用理论中有没有“含蓄原理”和“间接原理”?

合作原则语料分析

读一本语用学入门教材,那里面会介绍一些概念。在这些概念里,会有你比较感兴趣的几个概念,例如,合作原则,礼貌原则,请求,道歉,言语行为,预设,等等。你选了某个概念后,就要精读那一章内容,弄明白这个概念。然后,就可以从小说或者电视剧等上面找语料了,用这个概念(实际上就是理论)来分析这些语料,看它们是否符合这个理论原理。例如可以分析一段或几段话轮turn.看是否遵守了合作原则,以及合作原则里的哪些准则,就可以写成一篇语用学论文了。

如何给语料分类,语料分类的原则和标准

语料库建设中涉及的主要问题包括:

(1)

设计和规划:主要考虑语料库的用途、类型、规模、实现手段、质量保证、可扩展性等。

(2)

语料的采集:主要考虑语料获取、数据格式、字符编码、语料分类、文本描述,以及各类语料的比例以保持平衡性等。

(3)

语料的加工:包括标注项目(词语单位、词性、句法、语义、语体、篇章结构等)标记集、标注规范和加工方式。

(4)

语料管理系统的建设:包括数据维护(语料录入、校对、存储、修改、删除及语料描述信息项目管理)、语料自动加工(分词、标注、文本分割、合并、标记处理等)、用户功能(查询、检索、统计、打印等)。

(5)

语料库的应用:针对语言学理论和应用领域中的各种问题,研究和开发处理语料的算法和工具。

我国语料库的建设始于80年代,当时的主要目标是汉语词汇统计研究。进入90年代以后,语料库方法在自然语言信息处理领域得到了广泛的应用,建立了各种类型的语料库,研究的内容涉及语料库建设中的各个问题。90年代末到新世纪初这几年是语料库开发和应用的进一步发展时期,除了语言信息处理和言语工程领域以外,语料库方法在语言教学、词典编纂、现代汉语和汉语史研究等方面也得到了越来越多的应用。

语料库与语言信息处理有着某种天然的联系。当人们还不了解语料库方法的时候,在自然语言理解和生成、机器翻译等研究中,分析语言的主要方法是基于规则的(Rule-based)。对于用规则无法表达或不能涵盖的语言事实,计算机就很难处理。语料库出现以后,人们利用它对大规模的自然语言进行调查和统计,建立统计语言模型,研究和应用基于统计的(Statistical-based)语言处理技术,在信息检索、文本分类、文本过滤、信息抽取等应用方向取得了进展。另一方面,语言信息处理技术的发展也为语料库的建设提供了支持。从字符编码、文本输入和整理,语料的自动分词和标注,到语料的统计和检索,自然语言信息处理的研究都为语料的加工提供了关键性的技术。

做语言学毕业论文时想分析语料的词频,老师建议加标的方法。到底什么是加标?是按不同的标签分类吗?

加标: annotation.

it covers any descriptive or analytic notations applied to raw language data.

就是让对你收集的语料库中的语料加注进行描述或者分析的注解

________________________

我找不到地方回答你追加的问题。在这里补充:

你要做语料库词频分析,一定要分析关键词。而你老师建议的加注应该是针对关键词的加注,对于关键词加注如我上面所说,建议你可以要么做语法结构的描述,要么做语义的分析。

以GOT给你举几个结构分析的例子:

you GOT the right product.

that's why he GOT more.

we GOT to know it

etc.

这里GOT有几种结构:GOT+名词,+形容词,+TO,ETC。

依此类推,语义的相信你自己知道怎么去做。