


Content Anlaysis(内容分析法)是学习社会科学的同学们和正在做研究的社科研究者们时常会接触到一种数据分析手段。与我们之前extensively概括过的Thematic Analysis(主题分析法)类似,内容分析法时常是作为定性研究或者定量研究的分析方式出现在人文社科的research中。值得注意的是内容分析法存在的定量的元素,再加上它的种类较多,不仅涉及文字内容分析还涉及到视觉内容分析,就让它与其他的文字分析手段有着许多的不同。今天,小编就带大家一起来深度了解Content Analysis是什么,它的历史和用途,以及怎么样做内容分析法!
简单来说,内容分析法(Content Analysis/CA)是一种我们用来分析数据的方法。与thematic analysis(主题分析法)不同,虽然内容分析法大部分时候是用于定性研究中的,它同样可以通过定量的方式去进行。而且有趣的是内容分析法时常还出现在mixed method study(混合方法研究)中。
不管是定量的还是定性的内容分析法,它用于识别记录文字数据中 主要的模式、类别、以及主题。我们在进行内容分析时,需要系统地收集一组文本的数据,或通常情况下已经有了收集好的文本数据,这些文本可以是书面、口头或视觉内容,包括但不限于:
如心理学的研究者和同学们使用的数据通常会是采访的transcription或是研究被试/参与者的自述;学习媒体领域专业(如digital media)的同学们使用的数据可能不单单包括文字,还涵盖了照片、YouTube视频、短视频等类别。这也体现除了内容分析法的类别多样与在社会科学中的广泛应用性。至于具体的内容分析法的类别,我们会在下文中详细介绍。
内容分析可以是定量的(侧重于计数和测量),也可以是定性的(侧重于解释和理解)。无论哪种类型,研究者都会对文本中的单词、主题和概念进行分类或“编码”,然后分析结果。
虽然内容分析法(Content Analysis/缩写为CA)这个英文词汇诞生于20世纪40年代,准确来说是1941年,但它最最初的面貌其实早在17世纪或更早便在世界各地出现,例子包括了欧洲的教堂以及天主教学校专注于文字内容和意义的研究分析,以确保各种媒体发表的内容与神权政府的主张一致。另外一个例子甚至可以包括中国古代文学家、画家对于书籍、诗歌、国画的赏析分析。而现代研究(research)中使用的content analysis则有略微不同的方法和框架。
早在20世纪的上半叶(二战时期的美国),内容分析法就被政府用于对带有纳粹意识形态的宣传材料的检查和规范。而在社会科学领域,包括新闻学、心理学、商科科目、社会学、语言学、人类学等邻域,内容分析法真正地被大量传播且使用是在1950年左右开始。一些标志性的使用CA的研究包括心理学领域学者Allport在1942年发布的名为“The use of personal documents in psychological science”,其中讨论了使用类内容分析法来研究personal document/个人档案(包括如信件、日记、录音、回答等)。还有一个著名例子是心理学家Baldwin在1942年发布的额名为“Personal structure analysis: a statistical method for investigating the single personality”的研究,in which作者讨论了如何将文字内容的频率和其他特点作为统计单元来做量化分析。在1940年-1950年,内容分析法引起了一系列社科界的热烈讨论,而它替代以往传统实验分析方式的功能,在当时有着重大突破性的地位。当然,这里还有许多其他领域的案例,在不多举例的同时,感兴趣的读者可以查阅此文献来详细了解。
1969年,第一本系统性讨论Content Analysis的书出版: 《Content Analysis for the Social Sciences and Humanities》。之后一直到21世纪的今天,关于CA的学术/指导书籍层出不穷。重要的是,作为CA鼻祖的作者Holsti将内容分析定义为“通过客观和系统地识别消息中指定的特征来进行推理的任何技术”,侧面说明了内容分析法的个人独特性。
至此,内容分析法开始被全面使用。据Riffe和Freitag在1997年的报导,光是在新闻学领域,Content Analysis在1971至1995年的使用频率就增加了6倍。
在这里小编需要跟大家分享的是,社会科学家研究、分析文字的手段是从古代就有了的,但是内容分析法的出现相当于是给社科学者提供了一种全新的视角和一共公认的、、广泛运用的、相对来说值得信赖的分析手段。换句话来说,内容分析法出现之前,文字分析手段早已被使用延续了很久了,而CA本身是对它的predecessor的延伸、完善、以及科学化。
如上所属,社科类研究者主要是使用内容分析法来探究交流内容的目的、信息和影响。他们还可以分析文本的创作者及其受众。内容分析可以用于量化特定单词、短语、主题或概念在一组历史或当代文本中的出现频率,以此得出一些跟研究问题相关的结果和发现。
就对于大学这个环境来说,大家碰到CA的时候常常是因为教授布置的作业需要用到又或是自己的毕业论文/研究需要使用内容分析法来分析数据。作业类的Content Analysis通常以文字分析为主,在qualitative research课程中常出现。而谈及毕业论文(Thesis or Dissertation),Content Analysis的种类则繁多,不仅包括主要的文字内容分析,还涵盖了对图像和视频的分析。
综上所述,内容分析是用来“分析数据,以此得到研究问题答案的手段”。
而提到CA的用途,我们就不得不讨论它的类型,因为不可否认的是不同类型内容分析法—-不管类似于否或是都注重于文字分析—-都有着在某种程度上不同的用途。
CA的分类从某种角度来说,可以分为定性/质性的(qualitative)和量化/定量的(quantitative),而两种分类之下有许多细分,而且qualitative和quantitative两种方式可以同时在一个研究里使用。除此之外,CA的分类还可以按照具体每一种的功能和适用的案例情境来分类
下表根据功能和适用的situation来列出了一些常见的内容分析法种类:
如上所示,常见的内容分析法类型包括了以上7种。但是chances are, 9 out of 10 time, 你只会用到四种,包括:conventional analysis、conceptual analysis、relational analysis、和visual analysis。如果你使用的方法在这四种以外,那么恭喜你,你的研究是属于较独特的!话说回来,虽然每一种内容分析法都有着稍显独特的方式,具体怎么去实施它们却都有着非常类似的一个原则,那就是:寻找、分类、归纳、提取。
虽然这几个概念现在听起来可能比较抽象,在接下来小编将使用具体的案例和热身活动来让大家详细了解怎么样去使用内容分析法。After all,怎么使用内容分析法不就是在读的大家想要了解的核心吗?
在说所有接下来的内容之前,小编想强调,不管我们是用什么类型的内容分析,我们都需要先提出一个清晰、直接的研究问题。一个清楚的Research Question(RQ)是所有的前提!
在我们了解这个前提后,感兴趣的读者们可以先进行下面的热身活动:内容分析法小训练。
注*:大家可以根据自己喜欢的一段文字或专业偏向性来进行此训练(以下两段文字分别为商科和心理学的数据例子)
“Boost your day with EnergiX! Our all-natural energy drink is packed with essential vitamins and minerals to keep you feeling fresh and focused. Whether you’re at work, the gym, or just need a pick-me-up, EnergiX gives you the fuel you need. Say goodbye to sluggish afternoons and hello to lasting energy. Try EnergiX today and power through your day—naturally!”
“我没有任何动力做任何事情。我的心力憔悴,一直认为自己是一个失败者且非常恐惧外界对我的评判。我时常觉得自己无法从床上起来,四肢和眼皮都长时间处于疲惫状态。很多时候,我试图通过酒精和香烟来让我渡过最难受的时候或是在无力的时候让它们给予我一点精神,但效果似乎并不是我所预料的那样。4年的精神科就医经历也没有给我任何的改变,因为除了医生日复一日的那句服药,和药物带给我的种种副作用之外,我没有得到任何的东西。也许死亡是我现在唯一的归宿,但是冥冥之中我感觉到我不能因为自己的懦弱和身体精神上的痛苦而选择放弃。”
还记得小编说过的最重要的第一步吗?在此小编讨厌地再次强调一次:确定研究问题(research question)。在此,我们为上面两个文字数据分别设计了两个不同的研究问题:
Research Question (文字数据1):How does energy drinks establish brand image in order to enhance customer engagement?
Research Question (文字数据2):降低精神病患者的生活质量的因素有哪些?提高他们生活质量的因素有哪些?
下面让我们正式来根据这两个研究问题进行内容分析法训练!(此活动大家可以在笔记本或纸张上进行,也可以在电脑上下载这两个pdf,然后用高亮功能进行,并用批注功能进行命名,以及在word或其他文档工具中进行简单的分类)
第一步:根据研究问题,勾出或者高亮出文字数据中你觉得重要的部分。换句话来说,勾出文字数据中你觉得跟研究问题相关的部分;
第二步:用简单的词语或短句来给你勾出的这些部分命名;
第三步:将这些你命名好的部分进行分类,并将不同的分类再一次地命名;
在我们简单通过这个小练习了解熟悉了内容分析法的基本要素后,让我们来了解正式的Content Analysis是怎么进行的吧。
注:此种方法为最基本传统的CA操作方法,它的细节可能会随着内容分析法的区别而变化。
总的来说,content analysis(内容分析法)可以分为大致6个步骤:
根据研究问题(还是那句话,研究问题是第一步最主要的),选择要分析的文本,并决定:
例如:
接下来,我们需要确定分析的层级,包括:
根据主要需要用到CA的专业我们举一些例子:
编码是将文本信息归类到预定义的类别中。 尤其是对于概念性分类,明确编码规则至关重要,以确保所有文本的编码保持一致。
示例:
编码涉及将意义单元组织到先前定义的类别中。特别是对于更具概念性的类别,明确规定包含和不包含的内容至关重要,以确保所有文本的编码保持一致。
如果有多个研究者参与,编码规则尤为重要。但即使是由研究者本人独立完成编码,记录编码规则也能使研究方法更加透明和可靠。
依照编码规则,逐一分析每篇文本,并记录相关数据。这可以手动完成(事实上,很多期刊论文的内容分析也是用手工完成的),也可以借助软件(如 NVivo(最常用的一种)、Atlas.ti 和 Diction)来加快文本统计和分类的过程。其实编码听起来有点高大上,但是大家可以把它看作为做读书笔记、勾画词语句子、和高亮你觉得跟研究问题最相关的部分。编码并不是一蹴而就的,很多时候我们在第一次编码过后,可能会发现很多我们的编码不适合研究问题,编码太多,或是遗漏了重要的部分,所以说编码是一个循序渐进的过程。甚至有些时候我们在进行下面的步骤之后,还会回来再进行检查并完善、剔除、优化我们的编码。
示例:
完成编码后,我们需要分析数据以寻找模式,并根据研究问题得出结论。这可能涉及:
示例:
这一步涉及的细节较多,但是简单来说,你需要将你的分析过程在Methodology(方法论)部分说出,并且尽可能多解释和描述你做出的content analysis的方法。然后在results部分,当然我们需要做的是通过不同部分的方式将你得到的主要主题、发现、定量趋势、和推测与解读给详细写出来。再然后就是我们的conclusion部分,这个部分小编就不在这里多说啦。
当然,定量类型的内容分析法也是非常常见的,正如文章开头所说。所以在这里,小编专门另起了一个部分给大家简单展示一个模拟的定量内容分析法案例。
分析不同媒体报道气候变化时的情绪倾向(积极、中立、消极)。
| 编号 | 来源 | 日期 | 标题 | 情感倾向 | 主题 |
|---|---|---|---|---|---|
| 001 | CNN | 2024-03-15 | “气候危机加剧:海平面上升速度超出预期” | 消极 | 环境 |
| 002 | 福克斯新闻 | 2024-03-16 | “绿色能源革命带来新就业机会” | 积极 | 经济/就业 |
| 003 | 纽约时报 | 2024-03-18 | “世界领导人会面,商讨碳排放协议” | 中性 | 国际事务 |
| 004 | BBC | 2024-03-20 | “极端高温导致全球温度创历史新高” | 消极 | 环境 |
| 005 | CNN | 2024-03-22 | “青年活动家呼吁紧急应对气候变化” | 积极 | 社会运动 |
| 006 | 福克斯新闻 | 2024-03-25 | “气候变化数据显示本季度上升幅度有限” | 中性 | 科学报告 |
| 007 | BBC | 2024-03-26 | “英国将投资20亿英镑用于风能基础设施建设” | 积极 | 政府政策 |
| 008 | 纽约时报 | 2024-03-28 | “东南亚大规模洪水导致数千人流离失所” | 消极 | 环境 |
| 009 | CNN | 2024-03-29 | “中美气候合作展现希望” | 积极 | 国际事务 |
| 010 | 福克斯新闻 | 2024-03-30 | “批评者称气候政策损害小型企业利益” | 消极 | 经济/就业 |
积极:文章表达出乐观、解决方案、机遇或正向发展
中性:文章语气中立,事实陈述,不偏向任何情绪
消极:文章含有恐慌、悲观、威胁性或负面语调
而在这个分类编码的过程当中,相信大家也看到了一些与上面部分类似的步骤特点,它们包括:
确定研究问题: 例如:“主流新闻在报道气候变化时更倾向于消极还是积极情绪?”
选择分析单位: 每条新闻标题或完整报道都可以作为分析单位。
建立编码表: 创建用于标注每条内容情绪倾向的表格(积极、中立、消极)。
制定编码规则: 设定明确标准,定义何种语言或表达被认为是“积极”“中立”或“消极”。
进行编码: 由一个或多个编码员对数据进行标注。可以通过训练提高一致性。
分析数据: 使用统计方法(例如频率、百分比、卡方检验等)分析情绪倾向的分布。
解释结果: 结合背景分析结果的含义,例如哪类新闻更偏向消极或积极情绪,可能的影响因素等。
在该内容分析案例中,我们对媒体报道进行了系统性的量化编码,如:
每篇文章的情感倾向(正面、中性、负面)
涉及的主题类别(如外交、经济、文化等)
每类情感在每个主题中的频次
在不同年份或政府任期内的情绪变化趋势
这些都是数值型数据,可以用来进行统计分析。
使用标准化的编码表(Coding Sheet)对内容进行分类
使用统一的判断标准(例如是否出现特定关键词、情感分析模型的得分范围等)
编码结果可用于计算百分比、频率、平均数、趋势图
例如,通过对不同年份中报道中国的文章进行情感分析,可以:
比较不同总统任期对中国的报道态度是否有显著差异
分析是否某一类话题(如“人权”)更容易出现负面情绪 这些都可以用图表、相关分析、方差分析等统计方法进行呈现和检验。
在这里,我们对于内容分析法(Content Analysis)的介绍就结束啦。在之后的博客中,我们还会更新其他以定性研究为主导的数据分析方式,例如Discourse Analysis,大家敬请期待!谢谢大家的阅读。
如需Content Analysis代写、内容分析法代写、Content Analysis辅导、内容分析法辅导、定性研究代写、qualitative research代写、NVivo代做等服务,欢迎联系我们!
