日時:2000年2月25日(金)10:00〜17:15
会場:統計数理研究所講堂
出席者:会員27名、非会員26名(招待講演者を含む)
Professor Bock (Technical University of Aachen)に特別講演をお願いした。また以下の講演が行われ、活発かつ有意義な討論が行われた。
◆特別講演
Clustering Methods and Generalized Kohonen Networks
Hans-Hermann Bock (Technical University of Aachen, Germany)
The paper establishes a relationship between models and methods well-known from
classical cluster analysis and the analysis and construction of Kohonen maps
which visualize high-dimensional clouds of data points by the vertices of a
(two-dimensional rectangular) lattice. Our approach proceeds by first defining
a suitable clustering criterion (K-criterion) which measures the fit
between the point configuration and the vertex representation, in terms of a
weighted sum of Euclidean distances from class centers as in SSQ clustering.
Then (variants of) the classical algorithms for constructing or approximating
an optimum classification can be applied: the k-means algorithm, the
sequential approach by MacQueen, and the stochastic approximation
approach. This criterion-guided approach provides some alternatives to Kohonen's
basic 'self-organizing' algorithm and sheds some light on the type of the asymptotically
resulting configuration (including topological correctness).
A major advantage of the approach results from the possibility to generalize
it to situations where the classes (vertices) are not appropriately represented
by class centers (as in a normal distribution case), but where a distribution
model with class-specific parameter vectors might be more appropriate and describes
better the behaviour of the points inside the same class. This leads to algorithms
for 'model-based self-organizing maps' where, e.g., neighbouring vertices represent
clusters with similar regression models, principal components spaces etc.
◆一般講演
肺癌治療における薬価変動と治療費変動
園田 彩子・陳 凧彬・矢島 敬二(東京理科大学)
本研究は「癌治療の医療経済性に関するパイロット試験」の結果の一部をなすもので,毎年行われる薬価改正の医療費に与える影響を考察する.治療費の収集はレセプトから収集され1995-98年度に及ぶ131症例に関するものである.各症例の治療費は当該年次の薬価に基づくので薬品別に1995年次薬価と98年次薬価とに基づいて治療費を計算する.なお薬価には入院費,各種技術料を含む.治療費はすべて薬価表に基づくがレセプト上の記述と薬価表との対応には複雑な操作を伴う.
年齢・性別による価値観の差(3) −階層クラスター分析法とADCLUSによる分析−
岡太 彬訓(立教大学)
木村 好美(日本学術振興会,大阪大学)
1995年SSM調査データB票の価値に関する13個の質問項目に対し,階層クラスター分析法とADCLUSを用い,年代と性別の異なるコーホート間の価値観の違いについて分析を行った.その結果,年代(20代,30代,40代,50代,60代(60歳〜70歳))と性別(男,女)の組み合わせから成る10個のコーホートについて,価値観の違いが対外的志向−内的志向,物質主義−脱物質主義という2つの特性で説明できることが確認された.さらに,年代別にみた男女の価値観の乖離は40代で最大であり,60代で接近することが明らかになった.
「嗜好品」に関する意識の日米比較
松木 修平((財)たばこ総合研究センター)
代表的な嗜好品であるコーヒー,紅茶,酒(アルコール飲料),たばこに関する意識の日米間での差異・共通点を探るために,日本(関東1都6県)とアメリカ(北東部7州)においてアンケート調査を実施した.調査結果のうち,各嗜好品の摂取状況やメリット・デメリット意識,さらにライフスタイルについて検討した結果,以下のことが確認された.
嗜好品のメリットに関しては,コーヒー,紅茶,酒,たばこの4品目ともに,また日米ともに,ほとんどの項目において摂取者の方が非摂取者よりもその効果を強く認識しており,特に「リラックスできる」や「味や香りが楽しめる」を高く評価している. 一方,デメリットの健康有害性については,コーヒー,酒,たばこでは,日米ともに非摂取者の方が強く認識している.また,コーヒーと酒については,日本の方がアメリカよりも有害意識は低いが,たばこについては日米ともに有害意識が高く,両国間の評価に差がない.
さらに各嗜好品のデメリットやライフスタイルの検討から,日本では「健康志向」が,アメリカでは「健康志向」に加えて「宗教的な意識」が,酒とたばこの摂取・非摂取に影響しているようである.また,「健康志向」については,アメリカではそれが「目標志向」的であるのに対し,日本ではその反対の「なりゆき志向」的な傾向がみられた.
注)本報告は1999年10月に京都で開催された第6回ARISE国際シンポジウム(主題「楽しみと嗜好品を科学するシンポジウム ―QOLの向上を目指して」)での発表内容を一部修正したものである.
日本人・日系人・米国人の比較:日系人調査結果のデータ解析
山岡 和枝(帝京大学)
吉野 諒三・林 知己夫(統計数理研究所)
林 文(東洋英和女学院大学)
林知己夫と統計数理研究所のグループを中心に行われてきた7ヶ国調査およびハワイでの日系人調査の比較研究を行っていく課程で,連鎖比較調査分析法(CLA)の枠組みのなかで日本人特有の態度特性が明らかにされてきた.このような日本人特有の態度特性が日系人に受け継がれているかを検討するために,1998年に新に米国本土西海岸在住の日系人調査(JAWCS)が日系人の共同研究者(Frank
Miyamoto, Stephan S. Fugita, Tetsuden Kashima)の協力の下に行われた.対象はワシントン州のキング群およびカリフォルニア州のサンタクララ群在住の日系人である.
以前行ったCLAの結果とJAWCSの結果を基に,人間関係,社会的態度などに関する質問項目を分析した.特に日本人(J),ハワイの日系人(JA-HA), JAWCS,米国人(A)を分類することを中心とした.日本人特有の態度特性に関する質問では,(J)-(JA-HA,
JAWCS)-(A)というステレオタイプのクラスターが認められた.これに対して社会的態度に関する質問によるクラスターはそれとは異なり,それぞれの社会環境に関連してクラスターを成していた.
本研究は平成10年度より3ヵ年計画の文部省科学研究補助金・基盤研究A(2)(課題番号10308007研究代表者 吉野諒三)の助成を受けた.
国民性の国際比較とデータマイニング −データの質の評価とデータ分析−
林 知己夫(統計数理研究所 名誉教授)
国際比較におけるサンプル調査の問題点を2つ述べる.第1は,質問文の翻訳についてである.言語Aで書かれた質問文を言語Bに翻訳する場合,BからAに再翻訳し,もとの質問文と比較する.質問の意味の同等性検討のために,もとの質問文と再翻訳した質問文をスプリットハーフで調査して,比較可能性を調べることになる.第2は,調査法に関する問題,特に調査会社によるサンプリングとデータ収集法に関する問題である.多くの国では,サンプリングデザインやデータ収集上の問題が多いクオータサンプリングが用いられている.調査会社はそれぞれ独自のスキルを持っているが,テクニックやノウハウは財産であるがゆえに機密事項であることが多い.しかし,データの質はそういった事項に依存する.これらの問題を検討する.
クリスプ域のあるファジィクラスタリングについて
渡辺 則生(中央大学)
今泉 忠(多摩大学)
従来のファジィ k-means 法では,クラスタの重心と一致する場合のみ帰属度が 1 となる.本稿では,帰属度が 1 や 0 となるようなクリスプ域が存在するファジィクラスタリングをあらたに提案した.ここで提案した手法においては,重心を中心とする球でクリスプ域が与えられる.球の半径を
0 としたときは従来のファジィ k-means 法と一致する.数値例によって提案した手法の特徴を示した.
Relational Fuzzy c-Means for 3-way Data
佐藤 美佳(筑波大学)
ファジィクラスタリングの一手法として知られているRelational fuzzy c-means method (RFCM) について,適用される非類似性データが,いくつかの時点で観測されているような3-way
データである場合,拡張手法を二つ述べた.一つは,RFCMの解の関数とそのアルゴリズムから,いくつかの時点で得られている非類似性データを重み係数法を用いて2-wayデータに変換し適用したことに帰着する.他方の手法では,3-wayデータから時点間の非類似性の変化を示す構造を定義することにより,時点を通じてのクラスタリングの変化を抽出した.
これらの二つの手法で得られたクラスタリング結果(クラスターに対する帰属度)の比較のため,クラスターの等質性に関する基準を提案し,それを用いて比較を行った.
数値例により,これらの方法の妥当性を示した.
Fuzzy Clustering for Time-Dependent Similarity
佐藤 義治(北海道大学)
本報告は,時間に依存して変化する類似性データの潜在構造をクラスター構造の変化として捉えようとするものである.通常,各時点での類似性データをクラスタリングした結果を比較することは極めて困難である.たとえクラスター数が同一としても,各クラスターが,いかに変化したのかを結果として判定することは不可能に近い.そこで,本報告では,ファジィクラスターの特徴を生かして,時点間のクラスターの変化を連続的にトレースする方法を提案したものである.
損失関数最小化による射影と変数の分類
中村 好宏(総合研究大学院大学)
馬場 康維・大隅 昇(統計数理研究所)
多変量データの構造記述を行う手法として,Gifiによる等質性分析がある.この手法は,変数間の等質性を測る損失関数を定義し,その損失関数の最小化によりデータ構造の記述を行うものである.この等質性の概念の拡張によるデータ構造の記述法としてPML
(Projection method by minimizing loss function)が,さらにPMLを用いたクラスタリングの手法が中村により提案されている.本報告では,このクラスタリングの手法を連続量の実データに適用した例を示す.
企業への問い合わせレポートの分類のための情報抽出手法
諸橋 正幸・今泉 忠(多摩大学)
インターネットの普及に伴って様々な情報が手軽に集められるようになった現在,その情報を整理する技術がますます重要になってきている.こうした生の情報のうち,8割を占めるといわれているテキストに対するデータマイニングを行うための情報加工について考察する.
議論の対象としたのは「企業への問い合わせレポート」である.この中で頻繁に用いられる表現と顧客の意図を抽出するための言語処理技術や,その企業が扱う商品とそれが所属する業界,商品を利用する顧客の環境などから,レポートに現れる文章を正しく解析するための知識を如何に取り出すかが情報加工のキーとなる.
組織ゲノムを探る −企業,組織図コード化の試み−
石塚 隆男(亜細亜大学)
本稿は,企業組織や社会組織において自己複製の総体としての設計図に相当する概念として「組織ゲノム」を提案し,具体的に探ることを目的とする.今回は,企業の組織図データをコード化し,組織間距離に関する諸統計量を計算するプログラムを作成し,実際の組織図に適用を試みた.
組織間距離とは,組織図の上である組織から別の組織まで移動するのに必要なパス数をカウントした指標であり,その組織図の複雑度を表していると考えられる.組織図における直接の上下二項関係をコード化により,隣接行列や組織間距離行列を得ることができる.
教員志望学生における教員評価観 −自由記述を用いた意見分析−
吉村 宰(岡山大学)
教員志望学生の教育評価観の特徴及び自尊感情との関連を検討した.157名の教育学部学生を対象に質問紙による教育評価に関する意見聴取を行った.「あなたにとって評価されるとは?」に対する自由回答を分析し,回答者の評価観を「自己価値規定」「測定」「努力・過程」「診断」「外的統制」の5つのタイプに分類した.教員志望学生の評価観には他者からの評価を自己の価値を決定するものとして受容する「自己価値規定」タイプが多く,教員非志望学生には外的統制感を主張する「外的統制」タイプが最も多い,という特徴が観察された.さらに,評価観のタイプ別に自尊感情の高さを比較したところ,「自己価値規定」タイプの回答者の自尊感情は他に比べ低いことが分かった.
疲労・ストレス語の統計解析
土井 聖陽(宮崎産業経営大学)
大隅 昇(統計数理研究所)
62名の男子大学生に疲労感やストレス反応に関する自由回答と3種類の質問紙を実施し,InfoMiner with WinAiBASE(大隅,2000)によって,文章データと項目データを解析した.その結果,自由回答の単語から,疲労感,フラストレーション,攻撃性を抽出するとともに,これらの概念を複合的に有する回答者群も分類した.さらに,自由回答で疲労感を示す群の質問項目での疲労感は低く,これは攻撃性でも同様であったことから,質問紙とは異なる部分の測定を示唆し,この方法論の有効性と可能性を示した.