ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
言語
(Language)
号番号(Vol/No)発行日種別(Type)著者(Author)題名(Title)キーワード(Keyword)要旨(Abstract)ページ(page)
2
日本語33巻1号2021年6月20日研究ノート市村 葉子「ね」の伝達的機能―「そうなんですね」「んですかね」の使用に着目して―ね,そうなんですね,んですかね,伝達的機能,会話継続,会話コーパス本研究は,「ね」の複合形式である「そうなんですね」「んですかね」の分析をもとに,
近年の「ね」の伝達的機能の記述を試みた.具体的には,公開(収録)時の異なる複数の
会話コーパスを用いた両複合形式の使用割合を比較した.分析の結果,2000 年代に比べ,
2010 年代に公開されたコーパスでは①情報受容場面において「そうなんですね」の使用
が「そうなんですか」を上回っていること,②質問場面における「んですかね」の使用が
微増していることが明らかとなった.これらの結果から,近年における「ね」の伝達的機
能を「聞き手と会話を維持する意図があることを聞き手に明示する」と規定した.そして,
「ね」が選好されるのは,「会話継続」の意思を表明し,相手と円滑な人間関係の構築を目
指そうという,語用論的動機付けによるものと結論付けた.
1-10
3
EnglishVol. 33, No.1June 20, 2021NoteICHIMURA YokoThe Communicative Function of ne:
Focusing on the Use of sonandesune and ndesukane
ne, sonandesune, ndesukane, communicative function, maintaining a conversation,
conversation corpora
This study attempts to describe the communicative function of ne seen in recent years based on
an analysis of Sonandesune and ndesukane which are composite forms with ne. Specifically, we
compared the usage rates of both composite forms using multiple recorded conversation corpora.
The comparison of the corpus released in the 2010s with those released in the 2000s clarified
that (1) the use of Sonandesune exceeds Sonandesuka when receiving information and (2) the
use of ndesukane when asking a question is increasing slightly. Based on these results, we
considered the communicative function of ne seen in recent years to be “the speaker is clearly
indicating to the listener that s/he intends to maintain a conversation with them.” Our conclusion
is that the increasing use of ne is due to the pragmatic motivation to express the speaker’s
intention “to continue the conversation” and aim to build a harmonious relationship with the
listener.
1-10
4
日本語33巻1号2021年6月20日研究資料中俣 尚己,太田 陽子,加藤 恵梨,澤田 浩子,清水 由貴子,森 篤嗣『日本語話題別会話コーパス:J-TOCC』話題,話し言葉,日本語教育,知悉度,話題シラバス,語彙,文法項目話題が語彙・文法・談話ストラテジーなどに与える影響を検討するため,『日本
語話題別会話コーパス:J-TOCC』を構築した.このコーパスの最大の特徴は15
の話題を選定し,大学生のペアに5 分ずつ話してもらったことで,話題以外の条
件が統制されていることにある.話題は身の周りの話題が11,社会にかかわる話
題が4 である.1 つの話題につき120 ペア,合計10 時間の会話が収められてお
り,およそ11 万語に相当する.ペアは性別の組み合わせや録音地の東西でバラ
ンスをとった.また,話者がそれぞれの話題についてどのぐらい詳しいかという
話題知悉度についても尋ね,付属データとして添付している.
11-21
5
EnglishVol. 33, No.1June 20, 2021ResourceNAKAMATA Naoki
OTA Yoko
KATO Eri
SAWADA Hiroko
SHIMIZU Yukiko
MORI Atsushi
J-TOCC: Japanese Topic-Oriented Conversation CorpusTopic, Speaking, Education of Japanese Language, Degree of Familiarity,
Topic Syllabus, Vocabulary, Grammatical Items
We constructed the Japanese Topic-Oriented Conversation Corpus (J-TOCC) in order to study
the influence of topics on the vocabulary, grammar, and discourse strategies in conversation. The
main feature of this corpus is that the topics are fixed. University students were asked to engage
in conversation of 15 topics, and each conversation was recorded for precisely 5 minutes. This
means that conditions other than the topic are controlled. Eleven topics are related to daily life,
and four topics are related to society. In total, 120 pairs participated, so 10 hours of conversation
were recorded for each topic. J-TOCC contains about 1.6 million words in total. The pairs were
balanced in terms of gender combination and recording site. In addition, speakers’ degrees of
familiarity on each topic were surveyed and the data are attached to the corpus.
6
日本語33巻1号2021年6月20日書評宮澤 太聡石黒圭編(2020)
『ビジネス文書の応用言語学的研究―クラウドソーシングを用
いたビジネス日本語の多角的分析』ひつじ書房
22-26
7
日本語33巻1号2021年6月20日解説荻野 綱男言語統計学入門(1)―統計的な見方と言語研究―計量的研究,統計学,計量日本語学データには質的データと量的データがあるが,それとは異なる視点として,計量的な見
方と非計量的な見方がある.本稿では,計量的な見方による日本語研究がどんなものであ
るか,用例調査,コーパス,多人数質問調査などを例にして,その概略を述べた.また,
計量的な研究が現代日本語学で多く行われていること,そのような研究は,幅広い学問領
域に共通の研究のしかたであることを述べた.統計学とはどんなものか,記述統計学,推
測統計学,探索統計学に分類してそれぞれについて解説した.さらに,統計学的な見方と
計量的な見方の関係について,統計学が理論的,基礎的なデータ分析方法を追及するのに
対し,計量的な研究は応用的,実践的なデータ分析を志向するという立場から述べた.計
量的な言語研究を目指す上では,調査が重視されるが,その際のポイントとして,調査計
画の重要性と調査結果の解釈の重要性を述べた.
28-39
8
EnglishVol. 33, No.1June 20, 2021TutorialOGINO TsunaoAn Introduction to Statistics in Linguistics (1):
A Statistical Point of View and Linguistics
data, quantitative research, statistics, quantitative Japanese language studiesGenerally, data can be categorized as qualitative and quantitative, but besides that,
data can be analyzed from a quantitative viewpoint or a non-quantitative viewpoint.
This paper summarizes the analysis of Japanese language studies from a quantitative
point of view, referring to various perspectives, including usage examples, corpus, and
multi-person questionnaire-based surveys. It also points out that quantitative analysis
is a major analytical method in Japanese language studies that is commonly used in a
variety of other academic fields.
This paper also explains statistics by breaking it down into descriptive statistics,
inferential statistics, and exploratory statistics. Furthermore, it defines the differences
between statistical studies and quantitative studies. While statistical studies require
theoretical and fundamental methods of data analysis, quantitative studies use applied
and practical data analysis methods.
When conducting quantitative linguistic research, great emphasis is placed on the
investigation. Therefore, the importance of investigation planning and interpretation of
the outcomes when conducting an investigation is also discussed in this paper.
9
日本語33巻2号2021年9月20日論文B鄧 琪漢語名詞の連体修飾用法:異なる連体修飾標識の選択が
意味機能に及ぼす影響―漢語名詞「安定」を例にしたコーパス調査―
連体修飾標識,コーパス,漢語,「安定」漢語名詞は様々な連体修飾標識を介して名詞と接合することが知られているが,各種連
体修飾標識の典型性や,ジャンルおよび共起環境による典型性の変化は必ずしも明らかで
はない.そこで,本研究では,漢語名詞「安定」に注目し,「ナ」・「ノ」・「シタ」・「的φ」・
「的ナ」という5 つの連体修飾標識について,(1)個々の標識の典型性(頻度・レンジ),
(2)ジャンル,(3)共起環境(全体・前接要素・後続要素)の3 点を解明することを目
指す.その結果,(1’)5 つの連体修飾パターンのうち,「安定シタ」は最も典型的な形であ
ること,(2’)「安定ナ」は教科書ジャンルで,「安定的(ナ)」は白書・法律ジャンルで特
徴的に使用されること,(3’)各連体修飾パターンは異なる共起環境で生起しやすいこと,
などが確認された.本研究で得られた知見は漢語名詞の連体修飾構造の理解の深化に資す
るものと言える.
65-80
10
EnglishVol. 33, No.2September 20, 2021Paper (B)DENG QiThe Usage of Adnominal Modification on Kango Nouns: The Effect of
the Choice of Different Adnominal Modification on Semantic Function:
A Corpus Study Using the Kango Noun antei as an Example
adnominal modification, corpus, Kango, anteiThis study takes Kango antei as an example, elucidates how the semantic function is affected by
the use of five adnominal modification: na, no, shita, tekiφ, and tekina. Specifically, we focus on
three aspects: (1) frequency and range, (2) feature genres, and (3) collocations. The results show
that: (1) The frequency of antei-shita is the highest and the range of its use is the widest among
the five patterns, (2) antei-na is characteristically used in the textbook genre, while antei-teki
(na) is used in the white paper and law genres, (3) The use of antei as a technical term is limited
to the form of antei-na, and other forms are used for general meaning. We conclude that there
are manifold semantics and usages of the word antei, depending on the followed adnominal
modification.
65-80
11
日本語33巻2号2021年9月20日論文B亀井 信一在住外国人のための求職場面で使われる語彙の計量分析
―コーパスとテキストマイニングによるアプローチ―
日本語教育,使用頻度,コーパス,語彙調査,テキストマイニング,領域特徴語本研究の目的は,日本で生活する外国人が自立した言語使用者として職を得ることを日
本語教育の観点から支援することである.そのために,本稿では求人情報(求人票)を読
むのに必要な語彙の特徴,及び履歴書(志望動機)を書くのに必要な語彙の特徴を明らか
にすることを調査課題とした.調査データとして,ハローワークの求人票,及び日本語母
語話者が書いた志望動機の文章を用いてコーパスを作成し,品詞構成,出現頻度,特徴度
を分析した.その結果,求人票については,品詞として名詞が際立って多く,中級後半レ
ベルの語が最も多いこと,その傾向は業種間で差は無いことが明らかになった.志望動機
の文章については,特徴的な語として「貴社」,「志望」,「携わる」等があることが明らか
になった.また「〜たいと考える」等の頻出文型があることが明らかになった.
81-95
12
EnglishVol. 33, No.2September 20, 2021Paper (B)KAMEI NobukazuQuantitative Analysis of Vocabulary Used in Job Seeking for Foreign
Residents in Japan:An Approach with Small Corpus and Text Mining
Japanese-language education, Frequency of use, Corpus, Vocabulary survey,
Text mining, Characteristic words
The purpose of this study is to support foreigners living in Japan to get a job as "an independent
language user" from the viewpoint of Japanese language education. Therefore, I investigated the
characteristics of the vocabulary required to read job information and the characteristics of the
vocabulary required to write a resume. As survey data, I used text data form "HelloWork internet
service" and text data form sentences of resume written by native Japanese speakers, and
analyzed it for the part-speech composition, frequency of appearance, and degree of
characteristics. As a result, it was clarified that nouns were remarkably large as part of speech
and words in the upper intermediate level were the most common in the job information, and that
the tendency did not differ between industries. Regarding the sentences of resume, it became
clear that there are characteristic words such as kisha, shibou, and tazusawaru. In addition, it
became clear that there are frequent sentence patterns such as tai-to-kangaeru.
81-95
13
日本語33巻2号2021年9月20日書評岩崎 拓也田窪行則・野田尚史(編)(2020)
『データに基づく日本語のモダリティ研究』くろしお出版
96-99
14
日本語33巻2号2021年9月20日解説土山 玄言語統計学入門(2)
―統計的尺度と言語データ―
統計学,量的データ,質的データ,統計的尺度,データの可視化データはその値の持つ性質によって,名義尺度,順序尺度,間隔尺度,比例尺度の4 つ
に分類される.名義尺度と順序尺度は質的データ,間隔尺度と比例尺度は量的データと称
される.これらの統計的尺度はそれぞれ許容される演算が異なることから,それぞれの尺
度で測定されたデータに適した統計量およびデータの可視化の方法がある.本稿ではこれ
らの方法について概観した.また,言語データの多くが質的データであり,このようなデ
ータについて統計的なアプローチを行うために留意しなくてはならないことを述べた.
100-109
15
EnglishVol. 33, No.2September 20, 2021TutorialTSUCHIYAMA GenAn Introduction to Statistics in Linguistics (2):
Statistical Scales and Linguistic Data
Statistics, Quantitative data, Qualitative data, Statistical scales, VisualizationLinguistic data are typically classified based on the nature of the values into one of four
categories known as the nominal scales, ordinal scales, interval scales, and ratio scales. The
nominal scales and ordinal scales are useful for qualitative data and the interval scales and ratio
scales are useful for quantitative data. Since each of these statistical scales allows different
calculations, there are different statistical and data visualization methods suitable to each scale.
This paper gives an overview of these methods. In addition, given that the majority of linguistic
data are qualitative, in this paper, we show that researchers must be careful when taking a
statistical approach to such data.
100-109
16
日本語33巻3号2021年12月20日論文A真田 治子文の長さと節の長さの「自然な」均衡に関する研究― 翻訳文へのMenzerath–Altmann の法則の適用 ―Menzerath – Altmann の法則,言語的要素の長さ,文,節,形態素,
翻訳,『星の王子さま』,回帰分析
文が内包する言語的要素の長さの均衡の様相を知るために,海外の計量言語学で研究に
多用されているMenzerath – Altmann の法則(MAL)の手法を用いて調査を行った.『星
の王子さま』の日本語訳2 版を資料として,節の数で数えた文の長さと,その構成要素で
ある節を形態素の個数や文字数で計って関数とし,MAL の方程式を用いて回帰分析を行
った.Altmann が述べている通り,翻訳文においても文と節との関係は減少関数が得られ
た.2 つの版の回帰曲線は互いに似た傾向が見られた.一方で,分布している実データに
は減少関数から逸脱した箇所があり,添加や説明,挿入句,心内会話等を1 文に盛り込ん
でいる例が見られた.これらは日本語らしい長さの均衡を意図的に崩し,表現上の効果を
狙ったものと考えられる.
114-129
17
EnglishVol. 33, No.3December 20, 2021.Paper (A)SANADA HarukoA Study of the “Natural” Equilibrium between the Sentence and Clause Length:
Applying Menzerath–Altmann's Law to Translated Texts in Japanese
Menzerath–Altmann’s law, length of the linguistic elements, sentence, clause,
morpheme, translation, Le Petit Prince, regression analysis.
In order to understand balancing the lengths of linguistic elements contained in a sentence, we
conducted a survey using the Menzerath–Altmann's law (MAL), which is often used in
quantitative linguistics research in Europe and Canada. Using texts from two editions of the
Japanese translation of a French book, Le Petit Prince, as our study material, we construct a
dataset to create a function with the length of the sentence measured by the number of clauses as
x, the length of the clauses that constitute the sentence measured by the number of morphemes
as y, and the number of characters as y’. The regression analyses were performed on the linguistic
length dataset, employing the MAL equation. As Altmann stated, the association between the
sentence length and clause length is expressed by a decreasing function. The MAL holds even in
translated texts. The regression curves of the two editions tended to be similar to each other.
However, some data deviated from the MAL decreasing function, specifically, for cases with
additions, longwinded explanations, parenthetic expressions, or words expressing thoughts
without quotations. It can be regarded that these cases are intended to have an expressive effect
by means of breaking the balance of length among linguistic elements, which is typical in
Japanese expressions.
114-129
18
日本語33巻3号2022年12月20日論文A久屋 愛実英語由来語彙を公共コミュニケーションでどう運用するべきか
―全国調査のデータを活用した福祉言語学的考察―
英語由来の語彙,音訳借用,言語接触,公共コミュニケーション,社会言語学,地球語としての英語(English as a global language),福祉言語学(welfare linguistics),翻訳借用,ロジスティック回帰分析本稿は,英語由来の語彙(外来語)が公共コミュニケーションにおいてどのように運用
されるべきか,福祉言語学の視点から論じる.そのために,ロジスティック回帰分析を援
用して,これまでに蓄積されてきた外来語に関する全国調査のデータを統合し,新たな視
点からの検討を行う.分析の結果,(1)音訳借用語を使うことに関する意識(音訳借用語
に対する「選好度」)は一般市民と自治体職員の間で異なること,(2)一般市民の音訳借用
語の「理解度」は当該語彙に対する「選好度」とは必ずしも一致しないことが確認された.
これらの結果から,公共コミュニケーションの実践において情報発信者側が上記のデータ
を解釈・活用する際に留意すべき点について考察した.
130-145
19
EnglishVol. 33, No.3December 20, 2021.Paper (A)KUYA AimiTowards the Effective Adoption of English Loanwords for Japanese
Public Communication:A Welfare Linguistic Analysis of Data from National Surveys
English loanwords, homophonic translation, language contact,
public communication, sociolinguistics, English as a global language,
welfare linguistics, loan translation, logistic regression analysis
The present research, conducted from a viewpoint of welfare linguistics, discusses the manner in
which loanwords from English should be adopted for public communication in Japan. It explores
a new approach to interpreting data from national surveys on loanwords from English using
logistic regression analysis. The analysis reveals that there is often a discrepancy between the
general public and regional government workers in the level of preference for the adoption of
homophonic translation (a phonetic equivalent of the English word in katakana). It also reveals
that the general public’s level of comprehension, or literacy, of a certain homophonic translation
cannot be identified with their level of preference for the adoption of that word. These findings
suggest that better public communication could result if those who publish announcements, e.g.
regional government workers, take these issues into consideration.
130-145
20
日本語33巻3号2021年12月20日論文A今田 水穂児童作文における語彙多様性の評価児童作文,語彙多様性,線形混合モデル児童作文を用いて,24 種類の語彙多様性指標の信頼性を調べた.語彙多様性指標は延べ
語数と無相関であることが望ましいが,児童作文の場合は著者の作文能力に応じて語彙多
様性と延べ語数の間に相関が見られるため,集団全体で指標値と延べ語数が無相関である
ことは指標の信頼性の根拠にならない.そのため,同一作文中において累積的に指標値を
測定し,その変動の小ささをLMMで評価した.また,指標値の分布の形状を指定するパ
ラメータを用いる3 種類の指標について,LMM でパラメータを決定する補正を試みた.
この結果,Simpson 指数,実測的手法,LMMで補正した指標で比較的よい結果が得られ
た.これらの指標について著者の学年,および教員による作文評価(語彙評価)との関係
を調べ,学年が上がるほど語彙多様性が増大すること,教員の評価において語彙多様性は
それほど重視されていないことを確認した.
146-161
21
EnglishVol. 33, No.3December 20, 2021.Paper (A)IMADA MizuhoEvaluation of Lexical Diversity in Children’s Writingchildren’s writing, lexical diversity, linear mixed modelWe examined the reliability of 24 different lexical diversity indices using children’s
compositions. It is desirable that the lexical diversity index is uncorrelated with the text length,
but in the case of children’s writing, uncorrelatedness does not ensure the reliability of the index
because children’s language ability is correlated with both the text length and the lexical diversity.
Therefore, we measured indices cumulatively in the same composition, and evaluate the
smallness of its variation by LMM. In addition, we attempted to modify three types of indices
by using LMM to determine its parameter. It showed that the Simpson indices, the iterative
measurement methods, and the LMM-corrected indices gave relatively good results. We also
examined the relationship of these indices to the author’s grade level and the teacher’s evaluation
of their writing, and it was confirmed that lexical diversity increased as the grade level increased
and that the teacher’s evaluation did not place much importance on lexical diversity.
146-161
22
日本語33巻3号2021年12月20日論文A菅野 倫匡, 菊池 そのみ和歌集における品詞の構成比率の算出方法に関する試論
―計量語彙論のための標本抽出法を中心に―
計量語彙論,和歌,品詞の構成比率,標本抽出,サンプリング,単純無作為抽出法,集落抽出法計量語彙論においては品詞の構成比率に着目した研究が進められてきた.しかし,品詞
の構成比率は算出方法によって異なるものであるにも拘わらず,それによってどの程度の
差が生ずるかという点は顧みられてこなかった.この点について本稿は和歌を対象として
言語単位の問題,本文の問題,標本抽出の問題の3 つの側面から実証的に検討するもので
ある.まず,2 つの言語単位を用いて品詞の構成比率を比較すると両者の間に無視し難い
差が見られた.次に同一の和歌集の2 つの本文を用いて比較すると両者の間に大きな差は
認められなかった.続いて標本調査の結果と全数調査の結果とを比較すると統計的な誤差
は見られるものの結論を揺るがすような差は認められなかった.更に標本調査の結果から
和歌集全体の品詞の構成比率を推定する際には集落抽出法によって和歌を抽出する方法
が単純無作為抽出法によって語を抽出する方法に比して精度の面で優ることが示された.
162-177
23
EnglishVol. 33, No.3December 20, 2021.Paper (A)KANNO Michimasa
KIKUCHI Sonomi
A Tentative Study on How to Calculate the Proportions of Parts of Speech
in Japanese Poetry Collections:
An Emphasis on the Sampling Methods for Quantitative Lexicology
quantitative lexicology, waka, Japanese poetry, proportions of parts of speech,
statistical sampling, simple random sampling, cluster sampling
There has been much research on the proportions of parts of speech in the field of quantitative
lexicology. However, the issue of how much variation can occur when applying different
calculation methods has not been considered, even though the proportions of parts of speech
depend on them. Using waka poetry data, this study empirically examined the differences in
proportion for each calculation method in terms of three issues: word unit, variant texts, and
statistical sampling. The examination showed that the proportions determined by two different
word units had considerable differences, while the proportions calculated using two variant texts
of the same waka collection did not change substantially. Moreover, compared to the proportions
in the complete survey, the proportions in the sample survey identified statistical errors, but the
differences did not change the overall conclusion. Furthermore, when the proportions for the
entire waka collection were estimated from the sample proportions, it was revealed that the
sampling pieces of waka using cluster sampling yielded unexpectedly better results in terms of
the statistical precision than the sampling words using simple random sampling.
162-177
24
日本語33巻3号2021年12月20日論文B加藤 祥, 浅原 正幸IPAL 用言例文への印象評定情報付与と代表義・典型用例の抽出IPAL,多義語,代表義,印象評定,質問紙調査用例中の多義語の語義が,一般的な読み手によってどのように認定される傾向にあるの
か,印象評定を用いた調査を試みた.計算機用日本語基本辞書IPAL に含まれる用言(形容
詞・形容動詞・最重要動詞,計530 語)全文型の例文(5,125 例)に対し,文や用法に関
する読み手の印象評定,分類語彙表番号と山崎・柏野(2017)の代表義情報を付与した.
多義語の語義における代表義と印象評定を対照し,代表義の印象傾向を分析した.また,
各用例の代表義を算出することで,見出し語における読み手が典型的と考える用例を抽出
した.読み手の印象評定傾向から,助詞をはじめとする周辺語彙の差異により想起される
文脈が異なること,文脈情報が用例の意味認定に関わる可能性を考察する.
178-193
25
EnglishVol. 33, No.3December 20, 2021.Paper (B)KATO Sachi
ASAHARA Masayuki
Impression Rating Evaluation of Example Sentences for Verbs and
Adjectives in the IPAL Dictionary:
Their Representative Senses and Typical Usages
IPAL, polysemous, representative sense, impression rating, questionnaire studyWe performed large-scale impression rating experiments to investigate the evaluation of the
senses of polysemous words in example sentences. For the impression rating, we used 5,125
example sentences for 530 words in the IPA Lexicon of Basic Japanese Verbs, Adjectives, and
Nouns (IPAL). In addition, we annotated the sense tags of Word List by Semantic Principles and
their representative senses given by Yamazaki and Kashino (2017).
A contrastive survey between the representative senses and impression ratings was performed.
Further, linear regression analysis was performed to estimate the degree of representativeness
and extract their typical usages. We found that differences in contextual words, including case
particles, affect the recognition of word senses.
178-193
26
日本語33巻3号2021年12月20日研究資料中俣 尚己
小口 悠紀子
小西 円
建石 始
堀内 仁
自然会話コーパスを基にした『話題別日本語語彙表』話題と語彙,日本語教育,話し言葉,『名大会話コーパス』,特徴語,
特徴話題,機能語
本稿では会話コーパスを基に作成した『話題別日本語語彙表』についてその作成方法と
利用方法を解説する.本語彙表を作るために,まず「名大会話コーパス」を複数の作業者
で目視し,話題ごとにサブコーパスに分割した.次に,サブコーパスごとに対数尤度比を
計算し,列に97 の話題,行に3,324 語を並べたエクセル形式の表を作り上げた.『話題別
日本語語彙表』は「話題から語」,「語から話題」の2 方向で日本語教育の現場で活用でき
る.前者ではその話題でよく使われている語をリストアップすることができ,機能語や言
語行動なども見つけることができる.後者では類義語がそれぞれに使われている話題が違
うことに気づいたり,機能語にも使用される話題に偏りがあることを知ることができる.
194-204
27
EnglishVol. 33, No.3December 20, 2021.ResourceNAKAMATA Naoki
KOGUCHI Yukiko
KONISHI Madoka
TATEISHI Hajime
HORIUCHI Hitoshi
Compilation of “Topic-Vocabulary for Japanese Language Education”
from a Corpus of Natural Conversation
Topic and Vocabulary, Japanese Language Education, Speaking,
"Nagoya University Conversation Corpus", Specific Word, Specific Topic,
Function Word
This article describes how to create and use the “Topic-Vocabulary Table for Japanese Language
Education” which was elaborated based on a conversation corpus. To create this table, several
workers manually checked and divided the “Nagoya University Conversation Corpus” into
subcorpora for each topic. Then, log-likelihood ratios were calculated for each sub-corpus.
Finally, an Excel table was created with 97 topics arranged horizontally and 3,324 words
arranged vertically. This table can be used for Japanese language education in two directions:
from topic to word, and from word to topic. In the former, users can learn function words and
language behaviors in addition to frequently used words in the topic. In the latter, users can notice
that synonyms are frequently used in different topics for each, as well as a bias in the topics in
which functional words are used.
194-204
28
日本語33巻3号2021年12月20日解説中俣 尚己言語統計学入門(3)
―パーセンテージと比率―
割合,情報の圧縮,小数点,グラフ,パーセントポイント,pmw数値データを比率を用いて表すことは広く行われているが,それゆえに不適切な利用も
目立つ.本稿では比率をパーセントで表示する意義とその際の注意点についてまとめた.
まず,パーセントを内訳として使用する際には,100 を超えるデータの情報を圧縮して示
しているということに留意が必要である.非常に少ないデータをパーセントで表示したり,
小数点以下の値を細かく記述することは不適切な利用である.また,比率を用いて異なる
母数のデータを比較するときは何に対する比率であるかを意識することが重要である.パ
ーセント表示された値の差はパーセントポイントという単位を使って示さなければなら
ない.また,パーセント以外の比率の単位も存在する.コーパス言語学で用いられるpmw
という単位についても紹介した.
205-213
29
EnglishVol. 33, No.3December 20, 2021.Tutorial
NAKAMATA Naoki
An Introduction to Statistics in Linguistics (3):
Percentages and Ratios
Proportion, Compression of information, Decimal Point, Graph, Percentage Point,
PMW
Though percentages are widely used to express ratios of numerical data, occasionally, they are
inappropriately used. This article summarizes the significance of percentages and important
points to bear in mind when using them to express ratios. First, when using percentages in a
breakdown of data, it is important to bear in mind that percentages compress information on the
numbers of instances when the size of the dataset is greater than 100. Thus it is inappropriate to
use percentages with very small datasets or to give more decimal places than precision warrants.
When using ratios to compare data for different populations, it is important to be aware of what
the ratios are for. Also, a difference in values expressed as a percentage should not be expressed
by a percentage itself, but by percentage points. Finally, this article introduces units of ratios
other than percentages, including per million words (PMW), which is widely used in corpus
linguistics.
205-213
30
日本語33巻3号2021年12月20日学会参加報告真田 治子QUALICO 2021(国際計量言語学会大会)― 2021 年9 月9 日~11 日,於オンライン―214-218
31
EnglishVol. 33, No.3December 20, 2021.Conference ReportSANADA HarukoQUALICO 2021
International Quantitative Linguistics Conference
held online from September 9 to 11, 2021
214-218
32
日本語33巻4号2022年3月20日特集・招待論文 A 金愛蘭現代「語彙史」研究のためのコーパスと統計―『毎日新聞経年コーパス』による語の増減傾向の分析―語彙史,語彙調査,経年コーパス,リジット解析,増加傾向得点語の集合としての「語彙」の歴史的な変化,すなわち「語彙史」を記述するためには,
そのためのコーパスを用意する必要がある.また,それを利用して有意味な変化の傾向を
見出すためには,用いる統計手法についても工夫する必要がある.本稿では,筆者がこれ
まで作成・増補してきた(20世紀半ば以降の)『毎日新聞』の経年的なコーパスについて,
その内容と特徴とを紹介するとともに,同コーパスにおける語の増減傾向の分析を,従来
とは異なる統計手法の適用によって試みた結果を報告する.
233-248
33
EnglishVol. 33, No.4
March 20, 2022.
Invited Paper (A) KIM EranCorpus and Statistics for the Study of the History of Modern Japanese
Vocabulary: An Analysis of the Increase/Decrease of Word Usage Using
the Diachronic Corpus of Mainichi Shimbun
history of vocabulary, word count, diachronic corpus, ridit analysis,
increase/decrease of word usage
n order to describe the historical changes of "vocabulary" as a set of words, it is necessary to
prepare a corpus for this purpose. It is also necessary to devise statistical methods to find
significant trends of change using the corpus. In this paper, I introduce the contents and
characteristics of the diachronic corpus of the Mainichi Shimbun since the mid-20th century,
which I have created and expanded, and report the results of my analysis of the increase and
decrease of word usage in the corpus using ridit analysis.
233-248
34
日本語33巻4号2022年3月20日論文 A田中ゆかり,前田忠彦,林直樹,相澤正夫1 万人を対象とした全国方言意識 Web 調査に基づく話者類型 方言意識,潜在クラス分析,話者類型,地域差,年代差2015年に実施し全国の20歳以上の男女約1万人から回答を得た方言意識Web調査
(2015年全国方言意識Web調査)のデータを用い,潜在クラス分析によって話者類型を
抽出し,各類型の特徴記述とその解釈を試みた.抽出された七つの話者類型をクラスサイ
ズ降順に示すと,「消極的使い分け派」「積極的方言話者」「積極的使い分け派」「方言育ち
共通語話者」「共通語話者」「判断逡巡派1」「判断逡巡派2」となる.帰属確率平均値に着
目すると,クラスサイズの大きな主要5類型には,明らかな地域と年代の効果が認められ
た.地域の効果は現代日本語社会における方言と共通語に対する意識の地域差,年代の効
果は戦後日本語社会を構成する話者の意識が,「方言育ち共通語話者」から「共通語話者」
「積極的方言話者」へと変遷したことを映すものと解釈する.
249-264
35
EnglishVol. 33, No.4
March 20, 2022.
Paper (A) TANAKA Yukari
MAEDA Tadahiko
HAYASHI Naoki
AIZAWA Masao
Speaker Typology Based on a Nationwide Web Survey of Dialect
Consciousness among 10,000 People in Japan
dialect consciousness, latent class analysis, speaker typology, regional differences,
age group differences
Using data from the 2015 nationwide web survey on dialect consciousness, which was conducted in
2015 and received responses from approximately 10,000 males and females aged 20 and older
nationwide, we extracted speaker types using latent class analysis (LCA) and attempted to describe
and interpret the characteristics of each type. The seven speaker types extracted by the LCA, in
descending order of class size, are: (1) ‘moderate code switchers (between common language (CL)
and dialect)’, (2) ‘active dialect speakers’, (3) ‘active code switchers’, (4) ‘CL speakers who grew up
in dialect environment’, (5) ‘CL speakers’, (6) ‘indecisive respondent type1’, and (7) ‘indecisive
respondent type2’. In terms of the average membership probability, clear regional and age group effects
are found among the five major types with large class sizes. The regional effects are interpreted to
indicate the regional differences in the consciousness of dialect and CL in contemporary Japanese
society, and the age group effects are interpreted to reflect the transition in the consciousness of
speakers in postwar Japanese society from ‘CL speakers who grew up in dialect environment’ to ‘CL
speakers’ and ‘active dialect speakers’
249-264
36
日本語33巻4号2022年3月20日論文 B鈴木陽子親子談話における自他対応動詞 5 対の使用頻度の比較 動詞習得,自動詞,他動詞,使用頻度,親子談話 本研究は,1歳〜3歳の子どもと母親の自然発話データを対象に,5対の自他対応動詞
(「入る-入れる」「乗る-乗せる」「出る-出す」「壊れる-壊す」「開く-開ける」)に焦
点を当て,それぞれの動詞について,初期に獲得される6つの形態素(「る」(非過去),
「た」(過去),「て」(命令),「ちゃう」(完成相),「ない」(否定),「ている」(継続相))
と組み合わされる頻度を比較した.t検定の結果,自動詞と他動詞の総使用頻度には有意
な差がみられないが,4つの形態素(「る」,「た」,「ない」,「ている」)について自動詞の
方が有意に高い頻度で使用されていた.この傾向は子どもと母親の双方にみられ,子ども
の動詞使用が母親からの入力によって影響を受けていることが示唆される.また,自動詞
と他動詞の使用頻度の相関係数が高いことから,自他対応動詞の対の使用頻度における関
連性を示した.
265-280
37
EnglishVol. 33, No.4
March 20, 2022.
Paper (B)SUZUKI YokoA Study of Verb Forms of Five Japanese Transitive and Intransitive Verb
Pairs in Parent-Child Discourse
verb learning, transitive verb, intransitive verb, frequency, parent-children discourse
This study focuses on five Japanese transitive and intransitive verb pairs (hairu “enter,” ireru
“put in,” noru “get on,” noseru “put on,” kowareru /kowasu “break,” and aku /akeru “open,”)
and compares the frequency of verb forms that contain six morphemes (-ru (non-past), -ta (past),
-te (imperative), -chau (perfective), -nai (negative), and -teiru (continuous)) in spontaneous
speech data of children age 1-3 years old their mothers. Although there was no significant
difference in the overall frequency of user between intransitive and transitive verbs, intransitive
verbs were used significantly more frequently with four morphemes (-ru, -ta, -nai, and -teiru).
This trend was observed for both children and mothers, suggesting that children’s verb use is
influenced by input from their mothers
265-280
38
日本語33巻4号2022年3月20日書評尾崎誉治金明哲(2021)『テキストアナリティクス1 テキスト
アナリティクスの基礎と実践』岩波書店
281-285
39
日本語33巻4号2022年3月20日解説林直樹言語統計学入門(4)平均値に差があるのかないのか平均値,t検定,一元配置分散分析,多重比較 ,NHKニュース,
文の長さ,鶴岡調査,共通語音声
本稿では,言語データの平均値に差があるのかどうかを確認する際の統計的手法につい
て概説する.
まず,平均値の定義や適用事例について概説した後,言語研究分野における平均値の適
用事例について述べる.
続いて,統計的手法に基づく平均値の比較方法としてt検定と一元配置分散分析を取り
上げ,その計算法を示すとともに,実際のデータに基づき分析していく.
286-299
40
EnglishVol. 33, No.4
March 20, 2022.
TutorialHAYASHI NaokiAn Introduction to Statistics in Linguistics (4): Comparison of Meansmean, t-test, one-way ANOVA, multiple comparison, NHK news,
length of sentence, survey in Tsuruoka, standardization of segmental phonemes
This paper outlines a statistical method for checking whether there are differences in the mean
values of linguistic data. First, I will give an overview of the definition and applications of mean
value. Then, I will discuss some applications of mean values in the field of linguistic research.
Second, I will discuss t-test and one-way ANOVA as methods of comparing means based on
statistical methods, show how to calculate them, and analyze them based on actual data.
286-299
41
日本語33巻5号2022年6月20日論文 A李広微,金明哲現代小説の文末表現における通時変化の統計モデリングと 分析文末表現,通時変化,K 特性値,ランダムフォレスト,特徴的変数本研究では,現代小説における文末表現について機械学習の方法でモデリングし,どの
ような項目に顕著な変動が見られるかについて考察を行った.具体的には,1910 年から
2014 年までに出版された小説のコーパスを構築し,文末表現のデータを抽出して分析に
用いた.まず,語彙的豊富さの指標を利用して文末の多様性の変化を調査した.そして,
文末表現に関するモデルを構築し,モデル構築に大きく寄与する項目を抽出して考察を加
えた.分析の結果,時期の推移に伴い,文末表現がより多様になってきたことが明らかに
なった.そして,統計モデリングにより,小説の語り方や技法の変化を示唆する特徴的な
傾向が見出された.
309-324
42
EnglishVol. 33, No.5
June 20, 2022.
Paper (A) LI Guangwei , JIN MingzheStatistical Modeling and Analysis of Diachronic Changes in Sentence-
final Expressions in Modern Novels
sentence-final expression, diachronic change, characteristic' K, random forest,
characteristic variables
In this study, we applied a machine learning method to model the sentence-final expressions in
modern Japanese novels, and examined what kind of items exhibit remarkable fluctuations. Our
experiments were conducted on a diachronic corpus consisting of contemporary novels published
from 1910 to 2014. Sentence-final expression data were extracted from the corpus and used for
analysis. First, we investigated changes in the diversity of sentence-final expressions using the
index of vocabulary richness. Then, we constructed modeling related to sentence-final
expressions, and extracted the instrumental items playing important roles in model construction.
The results showed that the sentence-final expressions became more diverse with time.
Furthermore, statistical modeling revealed characteristic tendencies suggesting changes in the
narrative methods and techniques of novels.
309-324
43
日本語33巻5号2022年6月20日論文 A李文平,劉海濤,熊子涵日本語における語順の自由度と格標識の豊富さに関する計量的研究語順の自由度,格標識の豊富さ,文章ジャンル,量的指標 本研究では,「現代日本語書き言葉均衡コーパス」のコアデータに対する文節係り受け・
並列構造情報のデータを利用し,6つの文章ジャンルにおける語順の自由度,格標識の豊
富さ及び両者の相関を定量的に分析した.その結果,次の三点が明らかになった.第一に,
語順の自由度は白書,Yahoo!ブログ,Yahoo!知恵袋,新聞,雑誌,書籍の順に高くなる傾
向が見られた.第二に,格標識の豊富さはYahoo!ブログ,Yahoo!知恵袋,新聞,雑誌,書
籍,白書の順に高くなることが明らかになった.第三に,白書以外の5つの文章ジャンル
において,語順の自由度と格標識の豊富さの間に正の相関関係が見られた.本研究では,
日本語の語順の自由度と格標識の豊富さとの関係を初めて定量的に分析した.本研究の結
果は統語と形態との関係の面,及び言語普遍性の面から日本語をより深く理解するために
役立つと考えられる
325-340
44
EnglishVol. 33, No.5
June 20, 2022.
Paper (A)LI Wenping, LIU Haitao, XIONG ZihanA Quantitative Study of Word Order Freedom and Case Marking
Richness in Japanese
word order freedom, case marking richness, text genre, quantitative metrics
In this study, we use Balanced Corpus of Contemporary Written Japanese with annotations of
predicate-argument structures to quantify word order freedom, case marking richness, and the
correlation between the two in six text genres. The results of the study clarified the following
three findings. Firstly, it was found that the word order freedom tended to increase in the order
of white papers, Yahoo! Blogs, Yahoo! Chiebukuro, newspapers, magazines and books.
Secondly, it was clarified that the case marking richness increases in the order of Yahoo! Blogs,
Yahoo! Chiebukuro, newspapers, magazines, books and white papers. Thirdly, it was revealed
that a positive correlation was found between word order freedom and case marking richness in
five text genres other than white papers. This research is the first to quantitatively analyze the
relationship between word order freedom and case marking richness in Japanese. The results of
this study will be useful for a deeper understanding of Japanese in terms of the relationship
between syntax and morphology, and in terms of language universals.
325-340
45
日本語33巻5号2022年6月20日書評鯨井綾希髙崎みどり(2021)『テクスト語彙論 ― テクストの中でみることばのふるまいの実際 ―』ひつじ書房341-345
46
日本語33巻5号2022年6月20日書評林雅子前川喜久雄監修,伝康晴,荻野綱男編(2019)『講座日本語コーパス 7 コーパスと辞書』朝倉書店346-350
47
日本語33巻5号2022年6月20日解説入江さやか言語統計学入門(5)比率に差があるのかないのか標本,母集団,母比率,カイ二乗検定,カイ二乗値 言語を量的に分析する際は,コーパス調査やアンケート調査を行い,語・品詞・語種・
字種・共起語,「はい」と答えた人数,など様々な調査項目の頻度から比率を求め,その
差を用いて違いを述べることが多い.しかし,コーパス調査やアンケート調査は,全数調
査でなく,標本調査であることがほとんどである.標本調査で得た比率を母集団の比率と
同等に扱ってはいけない.また,比率で比較する場合でも,標本サイズは必ず記さなけれ
ばならない.10/50と20/50の比率と,4/20と8/20の比率はともに前者20%,後者40%
で同じで,比率の差は20ポイントであるが,後者の場合は,実質的な意味のある差では
ない.分母,すなわち標本サイズが重要である.本稿では,いくつかの具体例を計算式と
共に示しながら,比率に差があるのかないのかについて注意すべき点について述べる.統
計的な説明は最小限にとどめ,四則演算と平方根の知識で理解できる計算式で示す.
351-361
48
EnglishVol. 33, No.5
June 20, 2022.
Tutorial IRIE Sayaka An Introduction to Statistics in Linguistics (5) Whether There is a Difference in the Proportionsample, population, population proportion, chi-squared test, chi-squared value
Quantitative analysis of language is often stated using the difference of the proportion calculated
from frequency of various survey items such as words, part of speech, etymological types,
character types, co-occurrence words, and the number of people who answered "yes", by corpus
surveys and questionnaire surveys. However, most corpus surveys and questionnaire surveys are
sample surveys, not complete surveys. The proportion obtained from the sample survey should
not be treated the same as the proportion of the population. Also, even when comparing
proportions, the sample size must be stated. The ratio of 10/50 and 20/50 and the ratio of 4/20
and 8/20 are the same for the former 20% and the latter 40%, and the difference in ratio is 20
points, but in the latter case, it is not a statistically meaningful difference. In this paper, while
showing some concrete examples together with the calculation formulas, we describe the points
to be noted about whether there is a difference in the proportion. The statistical explanation is
kept to a minimum, and it is shown by a calculation formula that can be understood by knowledge
of four arithmetic operations and square roots.
351-361
49
日本語33巻6号2022年9月20日論文B大島英之中世における呉音漢音混読現象の展開
―『色葉字類抄』と『日葡辞書』の漢語語形の比較を通じて―
日本漢字音,漢語,呉音,漢音,漢字音の一元化,色葉字類抄,日葡辞書現代語では,言語(漢音ゲン+呉音ゴ)のように,呉音と漢音を混ぜ読み(以下「混読」と呼ぶ)する漢語は多くあるが,中世以前にはほとんどなく,後出の形とされている.しかし,特定の時代における混読の実態や,その通時的変遷については詳らかでない部分が多い.本稿では,呉音・漢音の音形が明らかに対立する漢字同士で構成される熟語を分母とした時の,呉音ないし漢音同士で読まれる漢語に対する,混読される漢語の割合を,「混読率」と定義し,中世の両端に位置する辞書資料における混読率を求めた.その結果『色葉字類抄』の混読率は約15%,『日葡辞書』の混読率は約24%と求まり,中世において混読現象が拡大していることが明らかとなった.中世に混読が増加した背景については,二資料に共通する漢語の語形を比較した結果から,特定の漢字に呉音・漢音どちらか一方が固定化する「漢字音の一元化」の影響が大きいことを論じた.373-388
50
EnglishVol. 33, No.6
September 20, 2022.
Paper (B)
OHSHIMA Hideyuki
The Blending of Go-on and Kan-on in Medieval Japanese:
Compared with Sino-Japanese Words Found in Iroha Jiruishō and Nippo
Jisho
Sino-Japanese, Sino-Japanese words, Go-on, Kan-on, unification of Sino-Japanese readings, Iroha Jiruishō, Nippo JishoIn modern Japanese, there are many Sino-Japanese words with two characters, one of which is read by Go-on and the other by Kan-on, such as gengo (gen is Kan-on and go is Go-on). It has been remarked that the blending of Go-on and Kan-on scarcely occurred until the medieval period. To quantitatively confirm this perspective, this study classified Sino-Japanese words with two characters, of which Go-on and Kan-on are explicitly distinct, into three categories, namely, Go-on, Kan-on, and blend reading words. The proportion of blend reading words to the other two words in Iroha Jiruishō (the Japanese dictionary compiled in the 12th century) is approximately 15%, and in Nippo Jisho (the Japanese–Portuguese dictionary compiled in 1603-04), it rises to approximately 24%. This result demonstrates that the blending of Go-on and Kanon increased during the medieval period. This study also pointed out that some examples of shifts between Go-on and Kan-on implies that the unification of Sino-Japanese readings, which means either Go-on or Kan-on becomes dominant for each character, influenced the spread of blending.373-388
51
日本語33巻6号2022年9月20日書評高橋雄太中俣尚己(2021)『「中納言」を活用したコーパス日本語研究入門』ひつじ書房389-393
52
日本語33巻6号2022年9月20日書評蔡 薰婕李在鎬(編)(2021)『データ科学×日本語教育』ひつじ書房394-398
53
日本語33巻6号2022年9月20日書評今田水穂田中久美子(2021)『言語とフラクタル-使用の集積の中にある偶然と必然-』
東京大学出版会
399-403
54
日本語33巻6号2022年9月20日解説間淵洋子言語統計学入門(6)―出現数が多い/少ないとは―検定,帰無仮説,対立仮説,有意水準,正確二項検定,カイ二乗検定,フィッシャーの正確確率検定,粗頻度,相対頻度,調整頻度言語研究における出現数の扱い方,評価について,母集団からの標本調査に基づく場合と,全数調査に基づく場合とに分け,数値計算の試行を交えて解説した.
標本調査における出現数の評価には,検定が有効である.言語調査では用例調査やアンケート調査等の分析でカイ二乗検定が多く用いられる.カイ二乗検定は,変数間の関係性を述べる際などに特に有効だが,標本サイズへの依存が大きく,期待値が極端に小さい場合や標本サイズが極端に大きい場合などには,正確な推定が難しい点に留意が必要である.一方,全数調査に基づく出現数の評価では,調査対象となった母集団全体の度数が重要である.古典語の資料間比較などでは,粗頻度ではなく母集団全体の度数をもとにした相対頻度を用いる必要がある.
404-414
55
EnglishVol. 33, No.6
September 20, 2022.
Tutorial MABUCHI YokoAn Introduction to Statistics in Linguistics (6):
How to Handle the Number of Occurrences
hypothesis testing, null hypothesis, alternative hypothesis, significance level, exact binomial test, chi-squared test, Fisher's exact test, raw frequency, relative frequency, adjusted frequencyThis paper explains how the number of occurrences of forms in linguistic research can be handled and evaluated, dividing the cases into those based on sample surveys from a larger population and those based on complete surveys; trials of numerical calculations are included.
There are numerous effective tests for evaluating the number of occurrences in a sample survey. In linguistic surveys, the chi-squared test is often used in the analysis of usage surveys and questionnaires. This test is particularly effective when describing relationships between variables; however, it is important to note that generating accurate results when the expected value is extremely small or when the sample size is extremely large is difficult because of the test’s strong sensitivity to the sample size.
In contrast, in the evaluation of the number of occurrences in a complete survey, the frequencies with respect to the entire population surveyed are important. For inter-source comparisons of classical words, it is necessary to use relative frequencies based on the frequencies in the entire population, rather than raw frequencies.
404-414
56
日本語33巻7号2022年12月20日特集・招待論文A中俣尚己並列を表す接続詞と文体―「まとめて検索KOTONOHA」を利用して―コーパス,「中納言」,主成分分析,語の硬さ,自己表現性,公共性,発話の計画性,集合の形成動機この論文では,「中納言」の包括的検索システムである「まとめて検索KOTONOHA」を利用し,話し言葉5ジャンル,書き言葉5ジャンルにおける並列を表す接続詞の出現状況を分析した.結果に対し,主成分分析を行うことで10ジャンルの関係を可視化するとともに,各接続詞の特性についても分析した.
分析の結果,ジャンルは4つのクラスターに分けられ,「職場談話」と「模擬講演」,「名大会話コーパス」と「日本語日常会話コーパス」が近い文体的特徴を持つことがわかった.また,「学会講演」は「新聞」「国会会議録」と同じクラスターに入る.さらに,4つのクラスターに特徴的な接続詞のグループは,接続詞を意味・用法の観点から分析した先行研究における分類と対応することが確認された.
422-434
57
EnglishVol. 33, No.7December 20, 2020Invited paper (A)NAKAMATA NaokiA Stylistic Analysis of Coordinative Conjunctions: Using “Comprehensive Searching System: KOTONOHA”Corpus, “Chuunagon”, Principal Component Analysis, Hardness of Words, Self-Expression, Public Announcement, Degree of Planning, Motivation of Grouping.This article analyzes the occurrence of coordinative conjunctions in five spoken corpora and five written corpora by utilizing the “Comprehensive Searching System: KOTONOHA,” a function of the corpus searching web-application “Chuunagon.” Principal component analysis was conducted on the results of the corpus survey in order to visualize the relationship among 10 genres as well as to describe each conjunction.
Consequently, 10 genres were divided into 4 clusters. “Workplace Conversation” and “Simulated Public Speaking” are in one cluster, while the two conversation corpus known as NUCC and CEJC belong to another cluster.. “Academic Presentation Speech” is in the same cluster as “Newspaper” or “Minutes of the Diet.” Furthermore, four groups of conjunctions which are specific to each cluster are found to correspond to the four groups of conjunctions in previous studies that analyzed conjunctions from the perspective of meaning and usage.
422-434
58
日本語33巻7号2022年12月20日特集・招待論文A馬場俊臣「語の文体」と「文章の文体」―『語の文体値データ』を利用した「文章の文体」の推定―『語の文体値データ』,語の文体,文章の文体,文章文体値,書き言葉的,話し言葉的,硬い文体,軟らかい文体,BCCWJコアデータ本稿では,まず,多数の語の文体(書き言葉的な硬い文体-話し言葉的な軟らかい文体)の程度差を連続的な数値で示している『語の文体値データ』の概要を紹介した.次に,このデータの活用例として,「語の文体」に基づいて「文章の文体」を,「文章文体値」という数値を用いて推定することを試みた.推定に用いた文章は,『現代日本語書き言葉均衡コーパス』のコアデータであり,各レジスターの文体的特徴を再現することができた.これを通して,『語の文体値データ』及び「文章文体値」が文体研究に有効に使えるデータであること,また,「語の文体」と「文章の文体」との相互依存関係を計量的手法により実証的に分析可能であることを示した.435-450
59
EnglishVol. 33, No.7December 20, 2020Invited paper (A)BABA ToshiomiOn "Style of Word" and "Style of Text": Estimation of the "Style of Text" Using the "Data for Word Stylistic Value""Data for Word Stylistic Value", style of word, style of text, text stylistic value, written-like, spoken-like, hard style, soft style, BCCWJ core dataIn this paper, we first presented an overview of the "Data for Word Stylistic Value" which shows continuous numerical values for the degree of stylistic differences (written hard style/spoken soft style) of many words. Subsequently, as an example of the use of this data, we attempted to estimate the "style of text" based on the "style of word" using a numerical value called the "text stylistic value." The texts used for the estimation were the core data of the "The Balanced Corpus of Contemporary Written Japanese" and were able to reproduce the stylistic characteristics of each register. Through this, we have shown that the "Data for Word Stylistic Value" and the "text stylistic value" can be used effectively for stylistic research, and that the interdependence between "style of word" and "style of text" can be empirically analyzed using quantitative methods.435-450
60
日本語33巻7号2022年12月20日特集・招待論文A小林雄一郎,
岡﨑友子
日本語歴史コーパスを用いた指示代名詞の通時的分析指示代名詞,通時的分析,日本語歴史コーパス,LOESS平滑化本研究は,日本語歴史コーパスに収録された奈良時代から大正時代までのテキストを用いて,指示代名詞の通時的分析を行うものである.指示代名詞の形態は時代によって若干異なるため,系列別(コ系列,ソ系列,カ系列,ア系列),型別(ゼロ型,ノ型,レ型,コ型,ナタ型,チ型)の分類に基づく分析を行った.具体的には,系列別・型別に集計された頻度に対してLOESS平滑化を実行することで,指示代名詞の使用傾向の経年変化を調査した.そして,(1)指示代名詞の総数が増加していくこと,(2)ソ系列は増加傾向を示し,コ系列とア系列は1700〜1800年代に多く,カ系列は緩やかに減少したあとで再び増加すること,(3)ゼロ型は減少傾向,レ型は増加傾向を示し,ノ型は1700年以降に増加し,他の3つの型はいったん増加したあとで減少すること,などを明らかにした.451-465
61
EnglishVol. 33, No.7December 20, 2020Invited paper (A)KOBAYASHI Yuichiro, OKAZAKI TomokoA Diachronic Analysis of Demonstrative Pronouns Based on the Corpus of Historical Japanesedemonstrative pronouns, chronological variation, the Corpus of Historical Japanese, LOESS smoothingThe purpose of the present study is to explore the chronological variation of demonstrative pronouns using the Corpus of Historical Japanese. As the forms of demonstrative pronouns change with time, this study utilized the classification based on the word-initial (ko-, so-, ka-, and a-) and word-final forms (zero, -no, -re-, -ko, -nata, and -chi). The locally weighted (LOESS) smoothing regression was performed to investigate the frequency change patterns of these word forms from the Nara to the Taisho period in Japan. The results show that (1) the total number of demonstrative pronouns increased, (2) the so- form increased, the ko- and a- forms were frequent in the 1700s and 1800s, and the ka- form increased after 1800, and (3) the zero form decreased, the -re form increased, the -no form increased after 1700, and the -ko, -nata, and -chi forms decreased in the early modern period after an increase in the Edo period.451-465
62
日本語33巻7号2022年12月20日特集・招待論文A岸本千秋SNSの文体をとらえる試み―ブログとTwitterを例に―ブログ,Twitter,ウェブ記号,品詞比率,字種比率,ロジット変換ブログとTwitterを対象として文体の特徴を明らかにした.ブログについては,品詞比率,語種比率の結果から,きわめて話しことば的であることを確認した.Twitterについては,品詞比率からは書きことばに近いととらえられるが,これは,字数制限が影響しているとの解釈が妥当であるとした.Twitterの語種比率では,和語の値が高く,話しことば的な俗語,書き手の感情や状況を強調して表す語,物事に対する評価などを表す語が上位にランクインした.また,ウェブ記号が文体にどのような影響を及ぼすかについて,ウェブ記号がある文とない文との品詞比率の差をロジット変換によって再表現した結果,ブログもTwitterも,ウェブ記号がある文は形容動詞・感動詞について,ウェブ記号がない文は,連体詞・接続詞についてより大きく評価された.466-480
63
EnglishVol. 33, No.7December 20, 2020Invited paper (A)KISHIMOTO ChiakiAn Attempt to Clarify the Characteristics of the Style of Social Networking Service: In the Case of Weblog and Twitterweblog, Twitter, web mark, ratio of parts of speech, ratio of parts of lexical stratification, logit transformation of dataThe purpose of this paper is to clarify the characteristics of the style of weblog and Twitter. The results of the examination of the ratio of parts of speech and the ratio of parts of lexical stratification of weblog confirm that the style of weblog is extremely close to that of spoken language. In the case of Twitter, its style is, based on its ratio of parts of speech, considered to be similar to that of the written language. But it is reasonable to interpret this as an effect of the limited number of letters and characters used there. As concerns the ratio of parts of lexical stratification of Twitter, the ratio of native Japanese words ranks higher: Colloquial or slang words, words that emphasize the writer's feelings, or words that evaluate things are used frequently. The effect of web mark in the style was reexamined by logit transformation of data, and its result showed that in both weblog and Twitter, sentences with web mark were highly rated for adjectival nouns and interjections, while sentences without web mark were highly rated for prenoun adjectivals and conjunctions.466-480
64
日本語33巻7号2022年12月20日特集・招待論文A土山玄夏目漱石の小説における文体の継時的変化について―文末表現についての計量的な検討―計量文献学,夏目漱石,ランダムフォレスト,主成分分析,回帰分析本研究の目的は,夏目漱石の小説において,出現傾向が継時的に変化する文体的特徴を明らかにすることである.夏目漱石は1905年から1916年まで作家として活動しており,本研究ではその間に発表された23作品を分析対象として採り上げた.ただし,会話文や書簡文は分析から除き,地の文のみを対象とした.分析ではランダムフォレスト,主成分分析,線形回帰分析を行った.その結果,文末表現が継時的に変化していることを明らかにした.特に,文末に用いられる助動詞の「た」は増加傾向にあることを示した.481-492
65
EnglishVol. 33, No.7December 20, 2020Invited paper (A)TSUCHIYAMA GenA Quantitative Analysis of Chronological Changes in Writing Style in Soseki Natsume's Novels: About Sentence-Final ExpressionsStylometry, Soseki Natsume, Random forest, principal component analysis, regression analysisIn this study, we analyzed the stylistic changes in sentence endings in novels by Soseki Natsume. Random forest, principal component analysis, and linear regression analysis were used to analyze the incidence of words appearing at the end of the sentences. Results showed that a change in the quantitative features of sentence endings occurred around 1908. In particular, seven works after "Sorekara," published in 1909, showed a similar trend. In addition, a consideration of eigenvectors in the principal component analysis revealed that the stylistic change in sentence endings recognized in 1908 was a marked increase in the use of the auxiliary verb "ta."481-492
66
日本語33巻7号2022年12月20日特集・論文A井関龍太,菊池理紗,望月正哉,福田由紀,石黒圭品詞構成に基づく文体指標は読者の印象とどのように関わるか―MVRと品詞構成率の心理学的検討―文体,品詞構成,MVR,主観的印象,文章心理学日本語の文章の文体特徴を品詞構成の観点から計量化した指標としてMVR(Modifier-Verb Ratio)が広く用いられている.このような指標によって捉えられた特徴は,読者が文章を読んで抱く印象とどのように関わるのだろうか.本研究では,MVRおよび品詞構成率と主観的印象との関係を質問紙調査によって検討した.マルチレベルモデルによる分析の結果,名詞率と動詞率は登場人物や場面のイメージしやすさの印象に負の影響を及ぼすが,形容詞・副詞類の割合はイメージしやすさに寄与しなかった.文ごとの品詞構成率を説明変数とすることによって品詞間の交互作用が明らかになり,形容詞・副詞類が多いほどイメージが浮かびやすくなるのは特定の品詞構成の組み合わせが成立した特殊な場合であることが示唆された.一方,展開の早さの印象については,本研究で扱った範囲では有望な説明変数を見出せなかった.品詞構成と文体の印象との関係について考察し,文ごとの品詞構成に着目することの意義,分析概念の再考について論じた.493-509
67
EnglishVol. 33, No.7December 20, 2020Paper (A)ISEKI Ryuta, KIKUCHI Risa, MOCHIZUKI Masaya, FUKUDA Yuki, ISHIGURO KeiRelationship Between Part-of-Speech-Based Stylistic Indicators and Subjective Impressions: Psychological Study of MVR and Part-of-Speech Compositionstylistics, part-of-speech composition, MVR, subjective impression, psychostylometryThe Modifier-Verb Ratio (MVR) is a widely used index for assessing stylistic features of Japanese texts in terms of part-of-speech composition. It is unclear how such elements are related to impressions resulting from reading a text. A questionnaire survey examined the relationship between MVR/part-of-speech rates and subjective impressions. Multilevel analysis indicated that noun and verb rates negatively affected imaginability, which was not the case for the modifier rate. We found an interaction between different types of part-of-speech by replacing the part-of-speech rates with the mean part-of-speech rates of sentences, which suggested that the more adjectives authors use, the easier it is for readers to imagine the scene depicted by texts, but only in that specific part-of-speech compositions. On the other hand, we did not find any promising explanatory variables for the impression of the speed of an unfolding story. We have discussed the relationship between part-of-speech composition and stylistic impressions, the significance of focusing on the part-of-speech composition of sentences, and reexamined the working definition based on this discussion.493-509
68
日本語33巻7号2022年12月20日特集・招待論文B大川孔明中世前期の文学作品の文体類型―叙述語を指標に―和漢の文体対立,和文,漢文訓読文,ジャンル文体,コレスポンデンス分析,クラスター分析本稿では,叙述語を指標に,コレスポンデンス分析,クラスター分析を用いて鎌倉時代の和文作品,並びに和漢混淆文の一種とされる軍記物作品の文体が類型的にどのように位置づけられるのかについて,大川(2020)の結果との比較から考察した.その結果,鎌倉和文は紀行文和歌集型と強紀行文和歌集-和文体型に分けられ,さらに大川(2020)にて強紀行文和歌集型とされた『海道記』は強紀行文和歌集-漢文訓読文寄りの文体型に位置づけられること,軍記物は物語日記-漢文訓読文寄りの文体型に位置づけられ,『今昔物語集』などの作品と,和漢の文体対立から見たときにも,ジャンル文体から見たときにも概ね同様の文体的特徴を有することが明らかとなった.510-525
69
EnglishVol. 33, No.7December 20, 2020Invited paper (B)OHKAWA KomeiA Stylistic Typology of Kamakura Period Literature: From the Perspective of Predicatesopposition of wa versus kan, wabun, kanbun kundoku-style, genre-related style, correspondence analysis, cluster analysisIn this study, I conducted a stylistic typology of literary works from the Kamakura period, including wabun ‘native-style literature’ and gunki mono ‘war chronicles, which are considered to be a type of wakan konkōbun ‘Japanese-Chinese hybrid style literature’, based on the properties of sentence predicates and a comparison with the results of Okawa (2020), using correspondence analysis and cluster analysis.
As a result, I found that Kamakura period wabun could be divided into two types: 1. standard kikōbun ‘travelogues’ and wakashū ‘waka anthologies’ and 2. wabun and kikōbun and wakashū with strong stylistic features. Gunki mono were grouped together with kanbun kundoku ‘vernacular reading of Literary Sinitic’-inspired literature and diaries, revealing that such chronicles have stylistic characteristics similar to works such as "Konjaku Monogatari-shu" in terms of opposition of wa versus kan, and in terms of genre-related style.
510-525
70
日本語33巻7号2022年12月20日特集・論文B李文平,劉海濤,呉長紅芥川龍之介の児童文学の文体に関する計量的分析芥川龍之介,児童文学,統語複雑度,統語依存関係,依存距離,文構造特性値,平均文長,語彙の豊富さ,語彙の難易度本研究では芥川龍之介の児童文学の文体的特徴を分析するために,芥川の児童文学8作品を対象に語彙の難易度,語彙の豊富さ,統語複雑度,平均文長を計量的に分析した.その結果,次の3点が明らかになった.第一に,芥川の成人文学に使われている語彙に比べて,芥川の児童文学に使われている語彙はより簡単であり,語彙の種類もより少ないことが明らかになった.第二に,彼の児童文学において統語複雑度は成人文学より低く,平均文長も短いことがわかった.第三に,芥川の児童文学の文体的特徴は一般の児童文学の文体的特徴をある程度反映していることが明らかになった.このことから,芥川の成人文学に比べて児童文学は読みやすいことが示唆された.これは彼が自らの子ども,親せきの子ども,主治医の子どもを直接の読者に想定して児童文学を創作したことによるものであると考えられる.526-540
71
EnglishVol. 33, No.7December 20, 2020Paper (B)LI Wenping, LIU Haitao, WU ChanghongQuantitative Analyses of Ryūnosuke Akutagawa's Children's LiteratureRyūnosuke Akutagawa, children's literature, syntactic complexity, dependency relation, dependency distance, characteristic value of sentence structure, average sentence length, lexical richness, lexical difficultyIn order to analyze the stylistic characteristics of Ryūnosuke Akutagawa's children's literature, this study employs eight children's literature of Akutagawa as the research object. This research makes a quantitative analysis of lexical richness, lexical difficulty, sentence length, and syntactic complexity. Three research findings reveal that: Firstly, in terms of lexicon, the use of the words is simple in Akutagawa's children's literature, and the vocabulary richness is relatively low. Secondly, in terms of sentences, the syntactic complexity and average sentence length of Akutagawa's children's literature are lower than those of adult literature. Thirdly, it is clear that the stylistic characteristics of Akutagawa's children's literature reflect some extent the stylistic characteristics of children's literature in general. Therefore, the reading difficulty of Akutagawa's children's literature is lower than that of adult literature. This may be due to the fact that the author assumed his own children, his relatives' children, and the doctor's child as their direct readers.526-540
72
日本語33巻7号2022年12月20日特集・招待論文・文献紹介丸山直子Jポップの歌詞研究―伊藤雅光氏の研究手法を用いた卒業論文の紹介―541-545
73
EnglishVol. 33, No.7December 20, 2020Invited Paper (Resource)MARUYAMA NaokoResearch on J-pop lyrics: Introduction of Graduation Theses Using Masamitsu Ito's Research Method541-545
74
日本語33巻7号2022年12月20日解説堀恵子言語統計学入門(7)クロス集計表の分析方法(その1)クロス集計表,調整頻度,周辺度数,期待値, カイ二乗検定,2項分布,フィッシャーの正確確率検定質的データを分析する際に,クロス集計表の形で示すことは,どのような手順で分析を行ったかを明確に示すために重要である.本稿ではクロス集計表に関わる用語を紹介した上で,条件とカテゴリー数の異なるクロス集計表について,検定法を示した.クロス集計表の種類は,2条件(対応がある場合,対応がない場合),対応のないi×j表を取り上げた.
また,カイ二乗検定を適用することが不適切となる場合の対応法として,⑴各セルのデータ数を一定数以上とするためにデータ数を増やすこと,⑵フィッシャーの正確確率検定を利用すること,を取り上げ,カテゴリーの合併の弊害についても述べた
546-556
75
EnglishVol. 33, No.7December 20, 2020TutorialHORI KeikoAn Introduction to Statistics in Linguistics (7): How to Analyze Crosstabulation Tables (Part 1)Crosstabulation tables, adjusted frequencies, marginal frequencies, expected values, chi-square test, binomial distribution, Fisher's exact probability testWhen analyzing qualitative data, it is important to present them in the form of crosstabulation tables so that the procedures used are evident. This paper introduces the terminology involved in crosstabulation tables and then presents the methods for testing crosstabulation tables with different conditions and several categories. Crosstabulation tables of two conditions (with and without correspondence) and i × j tables (without correspondence) are used.
Additionally, the adverse effects of category mergers are discussed, including (1) increasing the quantity of data so that the number of data in each cell exceeds a certain number and (2) employing Fisher’s exact probability test as a method for dealing with cases, in which it is inappropriate to apply the chi-square test.
546-556
76
日本語33巻8号March 20, 2023特集・論文B尾木竜司,池田大輔書き手の内面の変化に伴う文体の個人内恒常性の崩壊の検証―出産経験のある女性のSNS投稿を用いた調査―文体的特徴,計量的分析,縦断的調査,経年変化,SKLD,ソーシャルネットワーク,ブログ,ライフイベント,出産文章には書き手の個性が表れ,その個性は大きく変化しないこと(個人内恒常性)が知られている.逆に,メンタルヘルスの異常など書き手の内面の大きな変化が恒常性の崩壊につながることを示せれば,文体的特徴の変化から内面の変化を検出できるようになる可能性がある.特定の個人に対し,内面の大きな変化によって文体的特徴が変化することが示されているが,内面に同じ変化を持つ集団を集めるのは困難であり,統計的には示されていない.本研究では,出産は内面に大きな変化を与えると考え,出産経験のある女性らのブログの文体的特徴を調べた.単語の使用率など文章の内容に依存する特徴を用いると,書き手の内面の変化ではなく生活環境の変化を検出してしまう.そこで,非内容語の使用率や品詞のbigramの出現率などの,文章の内容に依存しない特徴を用いた.検証した全ての特徴において,出産を経ることで通常の変動よりも変化することがわかった.571-585
77
EnglishVol. 33, No.8March 20, 2023Paper (B) for the 2022 Special SectionOGI Ryuji, IKEDA DaisukeDisruption of Consistency in Writing Styles from Writer’s Internal Change: Analyses of Prenatal and Postnatal SNS Posts of Women
writing style, quantitative analysis, longitudinal study,secular change, SKLD, social network, blog, life event, childbirth
It is known that writing style depends on individuals and maintains consistency in each individual. If we can prove that some changes in writing style are caused by a significant transition in writer's state of mind including mental illness, psychological change can be detected from a change of writing style. Previous studies showed that, for a specific novelist, a transition in the writer's mind leads to changes in its writing style. However, little research has been conducted on population studies, because it is difficult to sample many people who have the same type of mind transition. To solve this problem, assuming that women make internal transitions when they become mothers, we constructed a large corpus of their blog entries before and after their delivery. If we select features that depend on the contents of the text such as frequency of words, we will find the changes of writing style based on shifts of their lifestyles rather than their internal transitions. Therefore, we used characteristics that do not depend on the topics of the text such as frequency of non-content words and bigram of parts-of-speech. This study shows that their internal transitions associated with childbirth causes their writing style change.571-585
78
日本語33巻8号March 20, 2023論文B陳暁静カタカナ語「ソフト」の形容動詞化と類義語の意味変化―類義語「やわらかな」「柔軟な」との比較から― カタカナ語 類義語 ソフト 柔軟な やわらかな『朝日新聞』のデータベース(ビジュアル聞蔵Ⅱ)を用いた調査によれば,カタカナ語「ソフト」は「ソフトハット」が山高帽に対し柔らかな「中折帽」を表す名称として導入され,その「ソフト」が次第に形容する対象と意味範囲を広げ,やがてナ形容詞「ソフトな」を生んだ.この成立以後,外来語とそれを修飾する新しい表現型を獲得した.また,類義分野では「やわらかな」の領域を浸食したが,「柔軟な」の領域とは関係しなかった.586-601
79
EnglishVol. 33, No.8March 20, 2023Paper BCHEN XiaojingOn a Change of the Loanword sofuto from a Noun to an Adjective Verb: Comparing with Synonyms yawarakana and junan’na
katakana synonyms sofuto junan’na yawarakanaThrough the investigation of Asahi Shimbun, Katakana sofuto was introduced as a soft hat which expresses a soft “trilby hat” against a “mountain cap” in the study. Gradually, sofuto began to appear in Japanese as a modifier and its meaning expanded. Soon, the adjective verb sofutona appeared. Since then, loanwords and their new modification methods have been absorbed by Japanese and occupied part of the meaning of yawarakana, but they have little influence on junan’na.586-601
80
日本語33巻8号March 20, 2023研究ノート横山詔一,前田忠彦,高田智和,相澤正夫,野山広,福永由佳,朝日祥之,久野雅樹日本人の読み書き能力1948年調査における非識字率と生年の関係読み書き能力,非識字率,生年,言語変化のS字カーブ説,キャズム理論,ロジスティック回帰分析,小学校就学率
1948年に実施された日本人の読み書き能力調査のデータを用いて非識字率と生年との関係を分析した.言語変化のS字カーブ説と見かけ上の時間の考え方を援用して,非識字率を目的変数,生年と居住地(市部/郡部)を説明変数とするロジスティック回帰分析をおこなった.その結果,非識字率と生年には逆S字カーブの関係が認められ,生年が遅くなる(年齢が若い,下限は15歳)ほど非識字率が低下することが明らかになった.その主要な原因として,義務教育無償化による学習機会向上の効果が時間経過とともに顕在化したことが考えられる.また,郡部の非識字率の逆S字カーブをグラフ横軸(生年)に沿って左方向に6年間分平行移動させると,市部の逆S字カーブに重なることも示した.602-611
81
EnglishVol. 33, No.8March 20, 2023NoteYOKOYAMA Shoichi, MAEDA Tadahiko, TAKADA Tomokazu, AIZAWA Masao, NOYAMA Hiroshi, FUKUNAGA Yuka, ASAHI Yoshiyuki, HISANO MasakiThe Relationship between Illiteracy Rate and Year of Birth as Seen in Data from the Survey of the Reading and Writing Ability of the Japanese in 1948reading and writing ability, illiteracy rate, year of birth, S-curve theory of language change, chasm theory, logistic regression analysis, elementary school enrollmentUsing data on illiteracy rate obtained from the survey of the reading and writing ability of the Japanese in 1948, we analyzed the relationship between illiteracy rate and year of birth. Referring to the S-curve theory of language change and the concept of diachronic change analysis using apparent time, logistic regression analysis was conducted with illiteracy rate as the objective variable and year of birth and place of residence (urban or rural) as explanatory variables. The analysis revealed an inverse S-curve relationship between illiteracy rate and year of birth, with the illiteracy rate decreasing with later year of birth (younger age at the time of the survey, with a lower limit of 15 years). The main reason for this is thought to be the increase in the rate of elementary school enrollment over time, which was linked to the introduction of free compulsory education. The analysis also showed that the inverse S-shaped curve of the illiteracy rate in the rural area overlaps with the inverse S-shaped curve in the urban area when the time of six years is shifted parallel to the left along the horizontal axis of the graph (year of birth).602-611
82
日本語33巻8号March 20, 2023文献紹介上阪彩香Stefan Th. Gries (2022) Toward more careful corpus statistics: uncertainty estimates for frequencies, dispersions, association measures, and more. Research Methods in Applied Linguistics, Volume 1, Issue 1
612-614
83
日本語33巻8号March 20, 2023書評李広微Pawłowski, Adam, Ján Mačutek, Sheila Embleton, George Mikros, eds. (2021) Language and Text. Data, models, information and applications. Amsterdam: John Benjamins Publishing.
615-618
84
日本語33巻8号March 20, 2023解説荻野綱男言語統計学入門(8)クロス集計表の分析方法(その2)
クロス集計表,拡張クロス表,交互平均法本稿では以下の4点を述べる.第1に,クロス集計表(クロス表)がどういうものであるかを述べる.本来のクロス表の例を示すとともに,それからやや外れた表も示し,クロス表の性質について考察する.第2に,同じ選択肢群による複数の質問群の単純集計を並べた拡張クロス表というものを提示する.拡張クロス表は従来のクロス表と同様に扱えるが,それとともにデータ分析に有利な点がいくつかあるので,それを解説する.第3に,拡張クロス表を扱うのに適した交互平均法の計算法を説明する.具体的なクロス表に基づいて,電卓でも計算できるように計算手順を示す.第4に,交互平均法の特徴を述べ,どのようなデータに適用するといいかを解説する.
このようにして,本稿全体として,クロス表の形で示されるデータを分析する際の交互平均法のメリットを述べることにする.
619-631
85
EnglishVol. 33, No.8March 20, 2023TutorialOGINO TsunaoAn Introduction to Statistics in Linguistics (8): How to Analyze Crosstabulation Tables (Part 2)
cross-tabulation table, extended cross-tab, reciprocal averagingThe following four points are discussed in this paper. First, the concept of cross-tabulation table (or cross-tab) is described; a conventional cross-tab example, along with its slightly modified version is presented, to examine the essence of cross-tab analysis. Second, an extended cross-tab, which is a table listing simple tabulation of multiple questions of the same choice group, is presented. The extended cross-tab can be handled in the same manner as the conventional cross-tab. In addition, it has several advantages for data analysis, which will also be explained. Third, the calculation process of reciprocal averaging suitable for using extended cross-tab is explained; this is done by presenting a step-by-step calculation process using a specific cross-tab example, so that the process can be performed using an electronic calculator. Fourth, the characteristics of reciprocal averaging are presented, and the types of its applicable data is explained. Thus, the present paper, as a whole, describes the advantages of reciprocal averaging in the analysis of data given in cross-tab format.619-631
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100