論文の解釈について
どんなに優れた論文であっても、正しい解釈ができなければ実際の臨床には役立てることができない。最初に、効果研究論文を読む際の留意点について書いておく。
対象
研究がどのような領域における、どのような問題を抱えた人を母集団として想定し、どのようにサンプリングを行ったかは確認しておかなくてはならない。想定された母集団ーサンプリングされた集団ー実際に臨床で対面するクライエントはそれぞれ異なるのであり、三つの差異を常に念頭に置いておくことが必要となる。
現場や対象者が多様化する現代の心理臨床において、自身の臨床の参照項としての効果研究論文における対象の解釈は重要である。自身がうつ病の人の臨床を行っているのであれば、うつ病の人を対象にした効果研究論文を読む必要があるように、なるべく自身が行っている臨床現場の条件と合致する条件で行われた論文を参照することが好ましい。実践と研究の条件が合致している程、臨床実践における治療効果の科学的再現性も高まる。
考慮されるべき条件としては、介入が行われる現場や、クライエントの抱える問題の他に、クライエントの性別や年代、国籍による文化の差異などもある。例えば、現時点における実存的心理療法の効果研究論文はほぼ全てが、外国の終末期医療という現場で行われたものである。このような死を目前にした臨床においては、宗教観などの文化的差異が大きな影響力を持ってくる。また、”生きた意味”を問うということと、”生きる”意味を問うということは、本質的に異なった要素を含むとも考えられる。従って、他の場面でこのような心理療法を用いる場合は、理論的な検討も必要となる。
介入
どのような技法をどのような順番で、何セッションに渡って実行したのかを確認しておかなければならない。例えば認知行動療法と一口に言っても、認知再構成法や行動活性化、エクスポージャーなど複数の技法がある。六つのコアプロセスを有するACTのような複雑な心理療法や、具体的な技法よりも抽象的な哲学的観点が重視されがちな実存的心理療法ではなおさら、実際の効果研究において具体的に何が行われたのかを確認しておくのは重要になる。
効果研究論文が支持する結果は、特定のアプローチそのものではなく、ある具体的な手続きで実際に行われたアプローチの効果である。研究における介入の詳細が十分に構造化、マニュアル化されていない場合、治療者の経験や能力といった剰余変数が交絡するため、効果研究としての信頼性も低くなる。
結果
結果を示す指標を測定するものとして、どのような心理検査が用いられたのかを確認しておかなければならない。次に、待機リストや他の心理療法との比較において、どこに有意差があったのかを確認しておく。
ここで重要なのは、心理療法の効果の信頼性(統計的な有意差)と、効果そのものの大きさは異なる、ということである。従って、大きな効果を示しているが、偶然の結果かもしれないという場合と、統計的な信頼性はあるが、実際の効果は微々たるものに過ぎない、という場合がある。統計的な有意差というものは、単純にサンプル数が多くなれば出やすくなるので、後者のような場合はメタ分析のような多くのサンプルを含む研究では多くなる。例えば、話の内容に関係なく、ただ単に会話をするだけでも多少は気晴らしとして効果があるとしたら、エナジーや前世などを扱う馬鹿げた心理療法でも効果を実証することは可能になる。検出力の高い研究デザインは微々たる効果でも有意性を示すことができるからである。
クライエントのために最も効果的なアプローチを選択しなければならない臨床実践においては、効果の大きさの解釈は統計的な優位性の確認と同じくらい重要である。効果研究において用いられている尺度が、他の研究や臨床で用いている尺度と異なる場合は、効果量(effect size)を算出して比較する必要がある。メタ分析であれば、効果量と共にその信頼区間も確認することができる。

論文の信頼性(エビデンスの質)について
この記事は基本的にランダム化比較試験(RCT)を念頭に置いて書いているが、実践を対象にした研究は他にもあり、どれくらい真実だといえるか(エビデンスの質)という点で様々な種類のものがある。ここではこれらの研究について重要だと思われることを書いておく。
システマティックレビュー・メタ分析論文
一般に、複数の研究をまとめたシステマティックレビュー論文と、複数の研究の統計データを再分析する研究であるメタ分析論文は、RCTよりもエビデンスの質が高いと言われている。これらの研究は多くのデータを含むことになる分、確かに信頼性そのものは高くなるが、欠点もある。それは論文としての焦点が幾分の抽象化を免れないという点で、そこでは上述したような実践に役立てるための論文の解釈に必要な詳細な情報が省かれてしまう。そもそも研究論文には新規性が求められるというのもあって、全く同じ追試という形の研究は少ない。そのため、~に対する~療法の効果研究のメタ分析、というようにある程度焦点を絞った研究でも、どうしてもそこで示される結果は実践の詳細を捨象することによって、ある程度の曖昧さを免れない。結局、常に具体的な場で行われる自らの臨床実践の参考にするためには、個々のRCTを読まなければならないことも多い。こうした事情から、この記事ではRCTを効果研究の中心においている。システマティックレビューとメタ分析論文は、それが結果として示す知見だけでなく、自分に必要なRCTの効果研究論文を探すガイドとして用いるのもとても役に立つ。
RCT意外の実践研究
一般に事例研究は仮説生成を目的として行われるもので、効果研究としては役に立たない。生成された仮説は本当に今目の前にいるクライエントのために有益なものなのか、臨床実践の参考にするためには仮説を検証するタイプの研究が必要である。
事例研究と同じように一つの事例を対象とした研究でも、ベースライン測定やABAモデルなどの実験デザインを採用し、介入のあり・なしという独立変数の操作を加えることによって、いくらかのエビデンスを得ることができる。
他方で、独立変数の操作を加えなくとも、サンプルを多くして統計的な優位差を得ることができれば、それも一定のエビデンスを保証するものとなる。この場合は、調査・観察研究となり、独立変数の交絡や因果関係の推定には注意しなければならない。
これらの研究を表にすると以下のようになるだろう。
研究、表
表の内部は点線で示しているように、これらはあくまで傾向を表しているものに過ぎない。実際にはRCTや調査研究でもサンプル数が数人に過ぎないような論文もあるし、独立変数を操作しているからといって、常に要因の交絡を回避できているとは限らない。逆に、一事例実験でもABABモデルを採用したり、調査研究でもあらかじめ交絡が予想される変数を測定し、偏相関係数を算出したりすることによって、研究の欠点を補い、エビデンスの質を高めることができる。
実践における基礎研究
RCT意外の研究は概して基礎的・予備的研究であって、研究のための研究であるから、臨床実践にとっては直接役に立たないかもしれない。しかし、これらの基礎的研究は、未だ哲学の心理学における理論化が不十分な実存分析などの心理療法などにおいては、重要なものである。一般に、効果的だと実証的に支持される心理療法が成立するためには、以下の過程を得なければならない。
哲学→心理学→心理療法
これは実存的心理療法だけでなく、認知行動療法や精神分析においても同様である。認知行動療法はデカルトやスピノザによって代表される大陸合理論と、ロックやヒュームによって代表されるイギリス経験論という、近代において発展した二つの哲学的基礎を持ち、それらの発想を実証的に証明することのできる認知心理学と学習心理学という二つの基礎心理学を持っている。
現代のエビデンスベイスドアプローチから見られる精神分析および深層心理学一般のうさんくささは、この過程をしっかりと歩めなかったことに起因すると筆者は見ている。精神分析は未だ一つの哲学から抜け出せていないのであり、実証可能な構成概念として心理学において再度理論化される必要がある。精神分析ほどの重大な学問が誤った仕方で受け継がれ、実践されている現代の状況は悲しむべきものと言わざるを得ない。

各統計的指標に関する留意点
サンプル数(n,number)
母集団から抽出されたサンプルの数。心理学の研究では基本的に研究参加者の数であるが、メタ分析では研究の数としても用いられる。ランダム化比較試験の効果研究では、各群に50人ほどはいると安心できる。
平均(m,mean)
誰もが小学校で習う、基本的な代表値。
心理学における平均という数値を見る際には、それが”特定の集団”における”平均化された人間像”の数値であることを忘れてはならない。平均が示す結果は誰にでも当てはまるわけではない。
従属変数や測定に用いた尺度が異なる場合、平均によって結果を比較することはできない。その場合は効果量を算出する必要がある。
ちなみに、平均以外の代表値には中央値と最頻値がある。散布度によってはこれらの指標も重要になる。
標準偏差(SD,standard deviation)
ある変数における全体のサンプルのばらつき度を表す指標。散布度を表す代表的な指標である。
それぞれのデータの平均からの差が偏差であり、それぞれの偏差を二乗し、総和した値をデータ数で除算した値が分散である。この分散の平方根が標準偏差となる。
標準偏差は効果量の算出や、結果の解釈の際に重要な値となる。効果研究においては、介入結果のデータの標準偏差が高い場合、注意が必要となる。それは、その心理療法によって、よくなった人とそうでない人との差が大きいことを意味している。全員が中程度によくなった場合と、半数は劇的に改善し、半数は全く改善しなかったという場合があっても、全体としての平均は同程度になってしまう。
効果量(d,effect size,standardized mean difference)
効果量とは、二つの群の平均値差を標準偏差で除算した値であり、分布によって相対的に評価される値であるため、従属変数や尺度の異なる結果間での比較が可能になる便利な指標である。
標準偏差で割るということから、標準得点と似ているが、標準得点はある一つのデータが示す値であるのに対して、効果量は複数のデータによって構成される群全体が示す値である。
基本的には効果量とは、以上のようなものなのであるが、平均値差を割るときの標準偏差として何を用いるのか(統制群or全体の標準偏差)、標準偏差が基づく母集団をどのように仮定するか(変量効果モデルor固定効果モデル)によって、分析や演算が異なってくる。この辺まで来ると筆者の統計学的知識では正直厳しくなってくるのだが、一つのメタ分析論文内における結果、フォレストプロットを理解する分には、恐らくそこまで考慮しなくてもいいだろう。
p値、t値、F値、X2
t値、F値、X2値はそれぞれ統計的仮説検定で用いられる統計的指標であり、それぞれt検定、分散分析、カイ二乗検定で使用される。p値はこれらの指標を用いた計算の結果、帰無仮説が生じる確率を表している。臨床家が論文を読む際には、基本的にp値を見るだけでいい。
信頼区間(CI,Confidence interval)
研究における標本の結果から推測される、母集団における値。標本誤差が少なく、推測の精度が高いほど、推測される値は明確になるため、この区間は短くなる。メタ分析論文におけるフォレストプロットを解釈する際に便利な指標でもあり、全体としての効果量の信頼区間が0をまたいでいなければ、その心理療法は優位な効果を持つことが支持されている。