論考記事スポーツ科学におけるN=1観察の認識論的意義と現場運用

ホーム > 論考記事 > 論考記事スポーツ科学におけるN=1観察の認識論的意義と現場運用

要旨

近年のスポーツ科学やフィットネス現場では、エビデンスに基づく実践(EBM)が重視されています。一方で、科学的根拠の不在を理由に、現場の有用な観察(N=1)が軽視される傾向にあります。

本稿では、トーマス・クーンの科学哲学およびデビッド・サケットらのEBM定義に立ち返り、個人の観察データが持つ認識論的意義を再考します。具体的には、EBMにおける「臨床家の専門技能」を再評価し、N=1の観察を逸話から構造化、そして個体内検証へと精緻化するプロセスとして体系化します。

結論として、現場の指導者は論文データと目の前の個の反応を対立させるのではなく、発見から検証へ橋を架ける「科学的観察者」として、両者の統合を目指すべきであると論じます。

本稿の射程

本稿が想定する読者は、健康なクライアントを対象とするパーソナルトレーナー、および自身の身体運用に関心を持つトレーニーです。

本稿は特定の疾患に対する医療的ガイドラインではありません。診断や治療を目的とせず、現場における意思決定の設計思想を扱います。

特に本稿では、統計的エビデンスと個別事例(N=1)の観察を対立させず、発見から検証へと接続するための認識論的枠組みを論じます。

なお、文中で触れるトレーニング頻度や食事法などの具体例は、N=1観察の論理構造を説明するための例示であり、特定の手法を推奨するものではありません。

また、本稿では個人の観察データを、集団統計における一標本(n=1)としてではなく、その個人固有のシステム全体、いわば「一人の母集団」として扱う立場から、大文字の「N=1」と表記します。これは、厳密な実験デザインを指す「N-of-1試験」とも区別される、現場特有の概念です。

はじめに

「この論文で、その手法は否定されました」「エビデンスがないので、それはプラセボ(思い込み)です」。近年、SNSを中心としたダイエットやフィットネスの言論空間では、こうした断定が飛び交っています。

論文の有無を判決にする推論様式

一見すると理知的ですが、問題は結論そのものではなく、観察→仮説→検証という手順を飛ばして、論文の有無を判決文にしてしまう推論様式にあります。既知の知見というフィルターでしか現象を評価せず、そこからこぼれ落ちる生々しい現実を切り捨ててしまっています。

本来、科学とは「分かっていること」と「分かっていないこと」の境界線を探り続ける動的なプロセスです。結論を急ぐ文化は、論文の有無だけで即座に正解を決める硬直した態度を生みやすいと言えます。

本稿の目的は、こうした現代特有の科学観に一度立ち止まり、現場における単一事例の観察(N=1)の科学的価値を再定義することにあります。

N=1を発見から検証へ送る問い

ここで擁護したいのは、N=1を「結論の最終審級」として祭り上げる態度ではありません。N=1は一般化の器ではなく、発見のセンサーです。したがって本稿の問いは「N=1で真理を証明できるか」ではなく、「N=1というセンサーが拾った信号を、いかに歪めずに仮説へ変換し、現場で検証可能な形へ落とすか」に置かれます。

統計的な有意差が得られないこと、あるいは研究が存在しないことは、効果がゼロであることの証明ではありません。むしろスポーツ科学の歴史において、現場の観察こそが未踏領域を切り拓く最前線でした。「論文」と「現場」の対立を越え、発見から検証へと接続する実践へ進む必要があります。そのためには、まず「科学とは何か」という根本から始めなければなりません。

第1章 科学哲学における「観察」と「発見」の再定義

通常科学の作法(外れ値処理)と発見の抑圧

普段「科学的だ」と信じられている営みの多くは、科学哲学者トーマス・クーンが『科学革命の構造』で呼んだ通常科学です[1]。これは、既存の理論(パラダイム)という枠組みの下で、パズル解きのように問題を解決していく作業を指します。

このプロセスにおいて、研究者は理論的予測と矛盾するデータに慎重になります。極端な値が出た場合、まず疑われるのは計測ミスやノイズです。これは悪意による隠蔽ではなく、パラダイムが規定する「解くべき問い」と「許容される解法」の枠内で整合性を追求する、通常科学の必然的な手続きでもあります。

通常科学の枠組みとアノマリー(変則事象)の価値

ただし、ここで言うアノマリーは、単に統計的に珍しい値と同義ではありません。統計的外れ値は、まず測定誤差や手続き逸脱として疑うのが通常科学の健全な作法です。しかし条件を揃えて反復しても消えず、既存モデルの予測と系統的に食い違う「外れ」が存在します。このとき初めて、その外れ値はクーンの意味でのアノマリー(変則事象)へ転化します。

スポーツ科学の現場において、このアノマリーに相当するのが、N=1の観察から得られる「消えない外れ」です。既存の理論モデルでは説明が困難な成果を出しているアスリートやボディビルダーは、単なる統計的外れ値ではなく、現在の科学モデルがまだ射程に収めていない領域を指し示す、生きたアノマリーである可能性があります。

彼らを無視して、綺麗な平均値だけの論文を書くことは簡単です。しかし、それはパズルを解いているだけであり、新しい地平を切り拓く行為ではありません。

「証拠の不在」と「不在の証拠」の峻別

ここでダグラス・アルトマンとマーティン・ブランドの警句、「証拠の不在は、不在の証拠ではない」[2]を想起すべきです。

統計的に有意差が出ないことは、直ちに「効果ゼロ」を意味しません。多くの場合それは、推定が不精確で区間が広いか、設計上の制約で検出力が不足していることを意味するに過ぎません。逆に、反復された研究で推定が十分に精密化し、実務上意味のある差を排除できる水準まで区間が収束して初めて、「不在の証拠」に近づきます。スポーツ科学では、この収束が未達の論点がまだ多いのが現状です。

未知の領域に対して安易に「ない」と断定するのではなく、「まだ分からない」という空白に耐え、そこにあるかもしれないアノマリーを注視し続けること。これこそが科学的な態度であると言えます。

この姿勢を現場の意思決定に落とし込むには、外的根拠だけでは足りません。何を根拠として採るか、どこまでを個に適用するか、そして当事者の価値とどう統合するかという「設計」が必要です。次章では、意思決定の設計思想としてEBMを再解釈します。

第2章 EBM(根拠に基づく医療)の再解釈と現場適用

フィットネス指導は医療ではありません。しかしEBMの枠組み、すなわち「外的根拠・専門技能・当事者価値の統合」という意思決定の設計は、スポーツ現場にも同じ構造で現れます。

EBM参照の理由(意思決定設計としての同型性)

現代のフィットネス現場において、エビデンスベースという言葉が、研究結果の適用可能性を吟味せず、文献の結論を直輸入するための免罪符として使われるきらいがあります。「論文にこう書いてあるから」と言えば、それ以上の思考停止が許されるような風潮です。しかし、この態度は、EBMの提唱者たちが最も恐れ、戒めていたことでもあります。

EBMの父と呼ばれるデビッド・サケットは、EBMが料理本医療になってはならないと警告しました。料理本医療とは、目の前の患者の個性を無視し、マニュアル通りに画一的な処方をすることです。近年の医学界でも、ガイドラインの過剰適用が個を無視する危機を招いていると警鐘が鳴らされています[3][4]

EBMの三要素と「臨床家の専門技能」の位置づけ

サケットらによるEBMの定義は、最良の研究根拠、臨床家の専門技能、患者の価値観と意向という3要素の統合です[3]。本稿はフィットネス現場を対象とするため、以降「患者」は「クライアント/トレーニー」と読み替えてください(原典の用語を尊重しつつ、意味だけ移植します)。

臨床家の専門技能は単なる経験則や直感ではありません。個別状況の評価、外的根拠の適用可能性判断、介入の設計・実装・再評価を含む技能体系です。現場の指導者が「論文ではこうだが、今のこの人には合わない」と感じ、微調整を行うプロセス。ここにこそ、EBMが料理本に堕ちないための中核があります。

プレシジョン・メディシンとN-of-1試験の認識論的共通性

平均的治療効果を個に適用する限界は認識されつつあり、プレシジョン・メディシン(個別化医療)の流れの中で、N-of-1試験の重要性が再評価されています[5][6][7]

オックスフォードEBMセンターの2011年版エビデンスレベルでは、N-of-1試験が高位に置かれるのは、「この個人への治療(介入)決定」という問いに対してです[8][9]。つまり、厳密に設計されたN-of-1が与えるのは、主として個体内因果であって、集団一般への一般化ではありません。ここを取り違えない限り、N-of-1は「個に対して最も強いエビデンス」たり得ます。

もちろん、現場の指導者が行う試行錯誤は、厳密な盲検化やランダム化を欠くことが多く、方法論的にはN-of-1試験と同一ではありません。しかし、「集団の平均値ではなく、個体の反応を最終的な判断基準とする」という認識論的態度において、両者は軌を一にします。現場の観察は形式的な実験ではありませんが、個別化が目指す方向性を共有する実践であると言えます[7]。N-of-1試験については、患者中心の比較効果研究の意思決定手法としても整理されており[10]、報告指針も整備されています[11]

ただし、この枠組みは理念として唱えるだけでは足りません。スポーツ科学では、まさに「現場が先に作った事実」が、後から理論の更新を促してきました。次章では、その代表的な構図を高頻度トレーニングの事例で確認します。

第3章 スポーツ科学史における現場実践の先行性

回復比喩の法則化と休息パラダイム

研究知見の受容はしばしば遅延し、現場の実践が先行して事実を作る局面があります。その象徴が、かつてのエブリデイトレーニング(超高頻度トレーニング)です。

休息重視の通念は、回復という現象を説明する便利な比喩として広まり、筋トレ領域では「48〜72時間」という経験則へ単純化されて流通しました。問題は、比喩や経験則それ自体ではなく、それが条件依存性を失って絶対法則として振る舞い始めることにあります。

休息パラダイムと高頻度トレーニングの事例

しかし1970年代を中心に、ブルガリア重量挙げナショナルチームは、当時の常識とは異なる超高頻度・高強度トレーニングを採用し、国際大会で顕著な成績を収めました。この成功には国家レベルのタレント発掘や当時の薬物使用の影響といった交絡因子を完全には切り離せません(注1)。それでも本稿で注目すべきは、休息こそが正義とされた時代に、真逆のアプローチで成果を出した事実が存在したという点です。

日本の現場における同時多発的な試行錯誤

高頻度という発想の再発見は、一国の特殊事情ではありませんでした。遠く離れた日本の現場でも、同様のパラダイムが時代を超えて芽吹いていたのです。

1990年代後半から2000年代にかけて、筆者自身、世間に何と言われようと高強度・高頻度が強くなると信じて続け、学生大会で結果を出しました。さらに、同じ環境でトレーニングを重ねた仲間も同様に高い成績を残しました。ここで言いたいのは成功談ではありません。休息重視が常識として流通していた時代にも、現場ではその常識と食い違う実践が機能し、事実が先に積み上がっていたという点です。

エブリベンチと起源神話の罠

この現象を世界最高峰の舞台で体現してみせたのが、国際パワーリフティング連盟(IPF)の殿堂入りを果たした世界王者・児玉大紀選手です。彼は、毎日ベンチプレスを行うという方法で世界王者にまで上り詰め、その実践を指す言葉として『エブリベンチ』が広まりました。

ここで注意すべきは、この成功がしばしば「誰の発明か」という単独起源の物語へ収束して語られる点です。起源を特定の個に固定すると、高頻度は理論更新を迫るアノマリーではなく、「例外的才能の特殊事例」として安全に処理されやすくなります。

さらに重要なのは、この「神話化」が、既存の理論を修正せずに済ませるための防波堤として機能してしまう点です。
「従来の理論は間違っていない。ただ、常識外れの例外(怪物)が現れただけだ」。
こう整理してしまえば、自分たちの地図(理論)を書き換えるコストを払わずに済みます。
その結果、アノマリーは理論更新の契機ではなく、「例外」という箱に隔離されて無害化されてしまいます。

だからこそ、本稿が注目するのは「誰が始めたか」という起源ではありません。ブルガリアから日本の学生に至るまで、時代や場所を超えて独立して同じ試行錯誤が起きていたという事実です。これは、その成果(エブリデイ法による記録向上)が「一人の天才による奇跡」ではなく、生物学的な法則に基づく「再現性のある現象」であることを示唆しています。バラバラだった個別のN=1が、単なる逸話を超えて、検証に値する仮説へと変わる。このプロセスを示すことこそが、本稿の意図です。

「ミネルヴァのフクロウ」としての事後検証的科学

ゲオルク・ヘーゲルは「ミネルヴァのフクロウは黄昏に飛び立つ」と言いました。知恵は、出来事が終わった夕暮れに初めてそれを解釈しに飛び立つ、という意味です。

スポーツ科学でも同じ構図があります。まず現場の実践者が泥臭い試行錯誤を行い、現象を作ります。そして遅れて研究者が現れ、理論化します。たとえば反復曝露による保護効果は、少なくとも筋損傷や炎症指標の側面から、繰り返し曝露で反応が変わる現象の一部を説明し得ます[12][13]

論文がないから効果がない、という批判はこの時系列を無視しています。論文がない時点での現場の実践は、非科学的なのではなく、探索段階として、まだ検証が追いついていない状態にあるのです。だからこそ観察は放置されるのではなく、構造化されて次の検証へ送られるべきなのです。

第4章 N=1観察の科学的昇華と方法論

現場の観察(N=1)は重要ですが、単なる思い込みと区別するには、観察の精度を段階的に上げていく必要があります。

本稿が現場に求めるのは、最初から実験室のような厳密さを真似ることではありません。発見の種を捨てずに、現場で実行可能な範囲で記録を整え、次の検証へ送れる形にすることです。

観察を精緻化する三つの水準:発見から検証への道筋

現場の観察は、その精度によって三つの水準に分かれます。それぞれの水準は優劣ではなく、果たす役割が異なります。

第一の水準は、非構造的な観察や主観的報告に基づく体験談です。バイアスや偶然の可能性は高く、これ単体で結論を出すことはできません。しかし、新しい仮説の種としてアノマリーを発見する源泉となります。ブルガリアの事例や学生時代の体験は、この水準に位置づきます。

第二の水準は、変数を管理し、事前に設定した測定指標を記録する、構造化された観察です。介入内容と条件を固定し、連続的に記録を取る試行錯誤です。厳密な因果の証明ではありませんが、目の前のクライアントにとっての最適解を導く手法として機能します。EBMにおける臨床家の専門技能の主要要素は、ここにあります。

第三の水準は、ランダム化・クロスオーバー・休薬期間等を設け、個体内因果を検証するN-of-1試験です。目的が「この個人への介入決定」に限定される限り、最上位のエビデンスたり得ます[8][9]

多くの誤解は、体験談をそのまま検証済みの事実であるかのように語ることから生まれます。さらに、介入前後の差分だけで「反応者/非反応者」を断定するような分類は、測定誤差や統計的揺らぎを個人差として取り違える危険を孕みます[14]。現場が目指すべきは、発見段階のヒントを無視せず、検証の論理を念頭に置きながら、精度の高い構造化観察を積み重ねることです。

逸話を構造化観察へ引き上げる最小手続き

体験談を構造化された観察へ引き上げる鍵は4点です。
介入と条件の固定、事前に定めたアウトカム指標、記録の連続性、そして可能なら反転(A→B→A)や複数回の切替です。
因果の証明ではなく、少なくとも「語り」から「観察」へ前進するための最低限の手続きとなります。

クロワッサン逸話の再記述

このモデルを念頭に、ボディビル業界で語り継がれる逸話を考えましょう。とある伝説的王者は、過酷な減量期間中に、あえて「クロワッサン」を主食の一部として食べていたといいます。

栄養学の常識からすれば、これは明らかに間違った手法に見えるでしょう。高脂質・高カロリーなクロワッサンを、よりにもよって減量期に食べる。この逸話はしばしば、トップ選手の天然ボケや「笑い話」として消費されてきました。

しかし、N=1の観察者として注目すべきは、「クロワッサンが痩せさせた」ではありません。観察された事実はより素朴にこうです――彼は減量期にクロワッサンを組み込みながら、コンディションを崩さずに勝ち続けた。

仮説の束から構造化観察へ

ここからの推論はアブダクション、すなわち「最良の説明への推論」であり、結論ではなく仮説の生成です。候補は複数あり得ます。

例えば、嗜好性の確保によるアドヒアランス(継続率)の維持。あるいは、食行動の反動(ドカ食い)を防ぐことによる総摂取カロリーの安定。食事タイミングやトレーニング設計との相互作用。彼に固有の消化・代謝特性。あるいは、そもそもクロワッサンは象徴に過ぎず、実体はその他の食事での等カロリー設計の巧妙さにあったのかもしれません。

重要なのは、「クロワッサンは魔法の減量食だ」という物語に飛びつくことではありません。これらの競合する説明(仮説)を束ね、現場で切り分け可能な問いへ落とし込むことです。

構造化された観察の実践としては、等カロリー条件での置換(クロワッサン↔別食品)、パフォーマンス指標・空腹感・主観的負荷・体重変動の連続記録、複数回の切替を行うだけで、少なくとも「笑い話」から「有用な観察」へと前進できます。

現場で求められるのは、こうした事例を「科学的でない」と嘲笑することではありません。既存理論で説明がつかない事実に直面したとき、自分の持つ地図(理論)の側を疑い、書き換える準備をしておくことです。

結語

SNSやネット記事では、「この論文で〇〇という手法は完全に否定された」という強い言葉が流通しています。分かりやすさという麻薬として機能するからです。しかし科学的結論は、測定・設計・解析の制約下での暫定的推定であり、追加データによって更新されるものです。

現場の人間がすべきことは、論文という現時点での最良の地図を尊重しつつも、それに盲目的に従うことではありません。地図にまだ載っていないが、目の前のクライアント(N=1)の身体で起きている事実や違和感を無視せず拾い上げ、構造化して次の検証へ送ることです。

検証されるのをただ待つのではなく、仮説を持ち、構造化された観察を続けること。まだ地図にない場所で、悩みながらも目の前の個に向き合い続けること。その泥臭い反復こそが、科学の未踏領域に立つ現場実践者の姿勢であると考えます。

注記

(注1)当時の東側諸国の記録に関しては、薬物使用(ドーピング)の影響を完全には切り離せない可能性があるほか、国家単位でのタレント発掘による選抜バイアスの影響も考慮する必要があります。

(注2)筋損傷・炎症と回復の時間経過は複合過程であり、頻度設計の議論では損傷指標とパフォーマンス指標を区別して扱う必要があります[13]

参考文献

[1] Kuhn TS. The Structure of Scientific Revolutions. Chicago: University of Chicago Press; 1962.

[2] Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ. 1995;311(7003):485. DOI: 10.1136/bmj.311.7003.485. PMID: 7647644. URL: https://pubmed.ncbi.nlm.nih.gov/7647644/

[3] Sackett DL, Rosenberg WM, Gray JAM, Haynes RB, Richardson WS. Evidence based medicine: what it is and what it isn’t. BMJ. 1996;312(7023):71–72. DOI: 10.1136/bmj.312.7023.71. PMID: 8555924. URL: https://pubmed.ncbi.nlm.nih.gov/8555924/

[4] Greenhalgh T, Howick J, Maskrey N; Evidence Based Medicine Renaissance Group. Evidence based medicine: a movement in crisis? BMJ. 2014;348:g3725. DOI: 10.1136/bmj.g3725. PMID: 24927763. URL: https://pubmed.ncbi.nlm.nih.gov/24927763/

[5] Guyatt G, Sackett D, Taylor DW, Chong J, Roberts R, Pugsley S. Determining optimal therapy—randomized trials in individual patients. N Engl J Med. 1986;314(14):889–892. DOI: 10.1056/NEJM198604033141406. PMID: 2936958. URL: https://pubmed.ncbi.nlm.nih.gov/2936958/

[6] Lillie EO, Patay B, Diamant J, Issell B, Topol EJ, Schork NJ. The n-of-1 clinical trial: the ultimate strategy for individualizing medicine? Per Med. 2011;8(2):161–173. DOI: 10.2217/pme.11.7. PMID: 21695041. URL: https://pubmed.ncbi.nlm.nih.gov/21695041/

[7] Schork NJ. Personalized medicine: time for one-person trials. Nature. 2015;520(7549):609–611. DOI: 10.1038/520609a. PMID: 25925459. URL: https://pubmed.ncbi.nlm.nih.gov/25925459/

[8] OCEBM Levels of Evidence Working Group. The Oxford 2011 Levels of Evidence. Oxford Centre for Evidence-Based Medicine; 2011. URL: https://www.cebm.ox.ac.uk/resources/levels-of-evidence/ocebm-levels-of-evidence

[9] Mirza RD, Punja S, Vohra S, Guyatt G. The history and development of N-of-1 trials. J R Soc Med. 2017;110(8):330–340. DOI: 10.1177/0141076817721131. PMID: 28776473. URL: https://pubmed.ncbi.nlm.nih.gov/28776473/

[10] Duan N, Kravitz RL, Schmid CH. Single-patient (n-of-1) trials: a pragmatic clinical decision methodology for patient-centered comparative effectiveness research. J Clin Epidemiol. 2013;66(8 Suppl):S21–S28. DOI: 10.1016/j.jclinepi.2013.04.006. PMID: 23849149. URL: https://pubmed.ncbi.nlm.nih.gov/23849149/

[11] Vohra S, Shamseer L, Sampson M, Bukutu C, Schmid CH, Tate R, et al; CENT Group. CONSORT extension for reporting N-of-1 trials (CENT) 2015 Statement. BMJ. 2015;350:h1738. DOI: 10.1136/bmj.h1738. PMID: 25976398. URL: https://pubmed.ncbi.nlm.nih.gov/25976398/

[12] McHugh MP. Recent advances in the understanding of the repeated bout effect: the protective effect against muscle damage from a single bout of eccentric exercise. Scand J Med Sci Sports. 2003;13(2):88–97. DOI: 10.1034/j.1600-0838.2003.02477.x. PMID: 12641640. URL: https://pubmed.ncbi.nlm.nih.gov/12641640/

[13] Peake JM, Neubauer O, Della Gatta PA, Nosaka K. Muscle damage and inflammation during recovery from exercise. J Appl Physiol (1985). 2017;122(3):559–570. DOI: 10.1152/japplphysiol.00971.2016. PMID: 28035017. URL: https://pubmed.ncbi.nlm.nih.gov/28035017/

[14] Hecksteden A, Kraushaar J, Scharhag-Rosenberger F, Theisen D, Senn S, Meyer T. Individual response to exercise training—a statistical perspective. J Appl Physiol (1985). 2015;118(12):1450–1459. DOI: 10.1152/japplphysiol.00714.2014. PMID: 25663672. URL: https://pubmed.ncbi.nlm.nih.gov/25663672/

付記

本稿は、パーソナルトレーニングジムPriGymにおける指導指針および意思決定の設計思想を言語化したものです。特定の疾患に対する医学的助言や診断を目的とするものではなく、健康なクライアントを対象とした指導現場における論点整理を主眼としています。

末岡 啓吾

末岡 啓吾

パーソナルトレーニングジム「PriGym」代表トレーナー。
博士(理学)・NSCA認定トレーナー・パワーリフティング元日本記録保持者。
科学と実践の両軸で、一人ひとりの成長を支えます。