A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 言語 (Language) | 号番号(Vol/No) | 発行日 | 種別(Type) | 著者(Author) | 題名(Title) | キーワード(Keyword) | 要旨(Abstract) | ページ(page) | |||||||||||||||||
2 | 日本語 | 33巻1号 | 2021年6月20日 | 研究ノート | 市村 葉子 | 「ね」の伝達的機能―「そうなんですね」「んですかね」の使用に着目して― | ね,そうなんですね,んですかね,伝達的機能,会話継続,会話コーパス | 本研究は,「ね」の複合形式である「そうなんですね」「んですかね」の分析をもとに,
近年の「ね」の伝達的機能の記述を試みた.具体的には,公開(収録)時の異なる複数の 会話コーパスを用いた両複合形式の使用割合を比較した.分析の結果,2000 年代に比べ, 2010 年代に公開されたコーパスでは①情報受容場面において「そうなんですね」の使用 が「そうなんですか」を上回っていること,②質問場面における「んですかね」の使用が 微増していることが明らかとなった.これらの結果から,近年における「ね」の伝達的機 能を「聞き手と会話を維持する意図があることを聞き手に明示する」と規定した.そして, 「ね」が選好されるのは,「会話継続」の意思を表明し,相手と円滑な人間関係の構築を目 指そうという,語用論的動機付けによるものと結論付けた. | 1-10 | |||||||||||||||||
3 | English | Vol. 33, No.1 | June 20, 2021 | Note | ICHIMURA Yoko | The Communicative Function of ne:
Focusing on the Use of sonandesune and ndesukane | ne, sonandesune, ndesukane, communicative function, maintaining a conversation,
conversation corpora | This study attempts to describe the communicative function of ne seen in recent years based on
an analysis of Sonandesune and ndesukane which are composite forms with ne. Specifically, we compared the usage rates of both composite forms using multiple recorded conversation corpora. The comparison of the corpus released in the 2010s with those released in the 2000s clarified that (1) the use of Sonandesune exceeds Sonandesuka when receiving information and (2) the use of ndesukane when asking a question is increasing slightly. Based on these results, we considered the communicative function of ne seen in recent years to be “the speaker is clearly indicating to the listener that s/he intends to maintain a conversation with them.” Our conclusion is that the increasing use of ne is due to the pragmatic motivation to express the speaker’s intention “to continue the conversation” and aim to build a harmonious relationship with the listener. | 1-10 | |||||||||||||||||
4 | 日本語 | 33巻1号 | 2021年6月20日 | 研究資料 | 中俣 尚己,太田 陽子,加藤 恵梨,澤田 浩子,清水 由貴子,森 篤嗣 | 『日本語話題別会話コーパス:J-TOCC』 | 話題,話し言葉,日本語教育,知悉度,話題シラバス,語彙,文法項目 | 話題が語彙・文法・談話ストラテジーなどに与える影響を検討するため,『日本
語話題別会話コーパス:J-TOCC』を構築した.このコーパスの最大の特徴は15 の話題を選定し,大学生のペアに5 分ずつ話してもらったことで,話題以外の条 件が統制されていることにある.話題は身の周りの話題が11,社会にかかわる話 題が4 である.1 つの話題につき120 ペア,合計10 時間の会話が収められてお り,およそ11 万語に相当する.ペアは性別の組み合わせや録音地の東西でバラ ンスをとった.また,話者がそれぞれの話題についてどのぐらい詳しいかという 話題知悉度についても尋ね,付属データとして添付している. | 11-21 | |||||||||||||||||
5 | English | Vol. 33, No.1 | June 20, 2021 | Resource | NAKAMATA Naoki
OTA Yoko KATO Eri SAWADA Hiroko SHIMIZU Yukiko MORI Atsushi | J-TOCC: Japanese Topic-Oriented Conversation Corpus | Topic, Speaking, Education of Japanese Language, Degree of Familiarity,
Topic Syllabus, Vocabulary, Grammatical Items | We constructed the Japanese Topic-Oriented Conversation Corpus (J-TOCC) in order to study
the influence of topics on the vocabulary, grammar, and discourse strategies in conversation. The main feature of this corpus is that the topics are fixed. University students were asked to engage in conversation of 15 topics, and each conversation was recorded for precisely 5 minutes. This means that conditions other than the topic are controlled. Eleven topics are related to daily life, and four topics are related to society. In total, 120 pairs participated, so 10 hours of conversation were recorded for each topic. J-TOCC contains about 1.6 million words in total. The pairs were balanced in terms of gender combination and recording site. In addition, speakers’ degrees of familiarity on each topic were surveyed and the data are attached to the corpus. | ||||||||||||||||||
6 | 日本語 | 33巻1号 | 2021年6月20日 | 書評 | 宮澤 太聡 | 石黒圭編(2020)
『ビジネス文書の応用言語学的研究―クラウドソーシングを用 いたビジネス日本語の多角的分析』ひつじ書房 | 22-26 | |||||||||||||||||||
7 | 日本語 | 33巻1号 | 2021年6月20日 | 解説 | 荻野 綱男 | 言語統計学入門(1)―統計的な見方と言語研究― | 計量的研究,統計学,計量日本語学 | データには質的データと量的データがあるが,それとは異なる視点として,計量的な見
方と非計量的な見方がある.本稿では,計量的な見方による日本語研究がどんなものであ るか,用例調査,コーパス,多人数質問調査などを例にして,その概略を述べた.また, 計量的な研究が現代日本語学で多く行われていること,そのような研究は,幅広い学問領 域に共通の研究のしかたであることを述べた.統計学とはどんなものか,記述統計学,推 測統計学,探索統計学に分類してそれぞれについて解説した.さらに,統計学的な見方と 計量的な見方の関係について,統計学が理論的,基礎的なデータ分析方法を追及するのに 対し,計量的な研究は応用的,実践的なデータ分析を志向するという立場から述べた.計 量的な言語研究を目指す上では,調査が重視されるが,その際のポイントとして,調査計 画の重要性と調査結果の解釈の重要性を述べた. | 28-39 | |||||||||||||||||
8 | English | Vol. 33, No.1 | June 20, 2021 | Tutorial | OGINO Tsunao | An Introduction to Statistics in Linguistics (1):
A Statistical Point of View and Linguistics | data, quantitative research, statistics, quantitative Japanese language studies | Generally, data can be categorized as qualitative and quantitative, but besides that,
data can be analyzed from a quantitative viewpoint or a non-quantitative viewpoint. This paper summarizes the analysis of Japanese language studies from a quantitative point of view, referring to various perspectives, including usage examples, corpus, and multi-person questionnaire-based surveys. It also points out that quantitative analysis is a major analytical method in Japanese language studies that is commonly used in a variety of other academic fields. This paper also explains statistics by breaking it down into descriptive statistics, inferential statistics, and exploratory statistics. Furthermore, it defines the differences between statistical studies and quantitative studies. While statistical studies require theoretical and fundamental methods of data analysis, quantitative studies use applied and practical data analysis methods. When conducting quantitative linguistic research, great emphasis is placed on the investigation. Therefore, the importance of investigation planning and interpretation of the outcomes when conducting an investigation is also discussed in this paper. | ||||||||||||||||||
9 | 日本語 | 33巻2号 | 2021年9月20日 | 論文B | 鄧 琪 | 漢語名詞の連体修飾用法:異なる連体修飾標識の選択が
意味機能に及ぼす影響―漢語名詞「安定」を例にしたコーパス調査― | 連体修飾標識,コーパス,漢語,「安定」 | 漢語名詞は様々な連体修飾標識を介して名詞と接合することが知られているが,各種連 体修飾標識の典型性や,ジャンルおよび共起環境による典型性の変化は必ずしも明らかで はない.そこで,本研究では,漢語名詞「安定」に注目し,「ナ」・「ノ」・「シタ」・「的φ」・ 「的ナ」という5 つの連体修飾標識について,(1)個々の標識の典型性(頻度・レンジ), (2)ジャンル,(3)共起環境(全体・前接要素・後続要素)の3 点を解明することを目 指す.その結果,(1’)5 つの連体修飾パターンのうち,「安定シタ」は最も典型的な形であ ること,(2’)「安定ナ」は教科書ジャンルで,「安定的(ナ)」は白書・法律ジャンルで特 徴的に使用されること,(3’)各連体修飾パターンは異なる共起環境で生起しやすいこと, などが確認された.本研究で得られた知見は漢語名詞の連体修飾構造の理解の深化に資す るものと言える. | 65-80 | |||||||||||||||||
10 | English | Vol. 33, No.2 | September 20, 2021 | Paper (B) | DENG Qi | The Usage of Adnominal Modification on Kango Nouns: The Effect of
the Choice of Different Adnominal Modification on Semantic Function: A Corpus Study Using the Kango Noun antei as an Example | adnominal modification, corpus, Kango, antei | This study takes Kango antei as an example, elucidates how the semantic function is affected by
the use of five adnominal modification: na, no, shita, tekiφ, and tekina. Specifically, we focus on three aspects: (1) frequency and range, (2) feature genres, and (3) collocations. The results show that: (1) The frequency of antei-shita is the highest and the range of its use is the widest among the five patterns, (2) antei-na is characteristically used in the textbook genre, while antei-teki (na) is used in the white paper and law genres, (3) The use of antei as a technical term is limited to the form of antei-na, and other forms are used for general meaning. We conclude that there are manifold semantics and usages of the word antei, depending on the followed adnominal modification. | 65-80 | |||||||||||||||||
11 | 日本語 | 33巻2号 | 2021年9月20日 | 論文B | 亀井 信一 | 在住外国人のための求職場面で使われる語彙の計量分析
―コーパスとテキストマイニングによるアプローチ― | 日本語教育,使用頻度,コーパス,語彙調査,テキストマイニング,領域特徴語 | 本研究の目的は,日本で生活する外国人が自立した言語使用者として職を得ることを日
本語教育の観点から支援することである.そのために,本稿では求人情報(求人票)を読 むのに必要な語彙の特徴,及び履歴書(志望動機)を書くのに必要な語彙の特徴を明らか にすることを調査課題とした.調査データとして,ハローワークの求人票,及び日本語母 語話者が書いた志望動機の文章を用いてコーパスを作成し,品詞構成,出現頻度,特徴度 を分析した.その結果,求人票については,品詞として名詞が際立って多く,中級後半レ ベルの語が最も多いこと,その傾向は業種間で差は無いことが明らかになった.志望動機 の文章については,特徴的な語として「貴社」,「志望」,「携わる」等があることが明らか になった.また「〜たいと考える」等の頻出文型があることが明らかになった. | 81-95 | |||||||||||||||||
12 | English | Vol. 33, No.2 | September 20, 2021 | Paper (B) | KAMEI Nobukazu | Quantitative Analysis of Vocabulary Used in Job Seeking for Foreign
Residents in Japan:An Approach with Small Corpus and Text Mining | Japanese-language education, Frequency of use, Corpus, Vocabulary survey,
Text mining, Characteristic words | The purpose of this study is to support foreigners living in Japan to get a job as "an independent
language user" from the viewpoint of Japanese language education. Therefore, I investigated the characteristics of the vocabulary required to read job information and the characteristics of the vocabulary required to write a resume. As survey data, I used text data form "HelloWork internet service" and text data form sentences of resume written by native Japanese speakers, and analyzed it for the part-speech composition, frequency of appearance, and degree of characteristics. As a result, it was clarified that nouns were remarkably large as part of speech and words in the upper intermediate level were the most common in the job information, and that the tendency did not differ between industries. Regarding the sentences of resume, it became clear that there are characteristic words such as kisha, shibou, and tazusawaru. In addition, it became clear that there are frequent sentence patterns such as tai-to-kangaeru. | 81-95 | |||||||||||||||||
13 | 日本語 | 33巻2号 | 2021年9月20日 | 書評 | 岩崎 拓也 | 田窪行則・野田尚史(編)(2020)
『データに基づく日本語のモダリティ研究』くろしお出版 | 96-99 | |||||||||||||||||||
14 | 日本語 | 33巻2号 | 2021年9月20日 | 解説 | 土山 玄 | 言語統計学入門(2)
―統計的尺度と言語データ― | 統計学,量的データ,質的データ,統計的尺度,データの可視化 | データはその値の持つ性質によって,名義尺度,順序尺度,間隔尺度,比例尺度の4 つ に分類される.名義尺度と順序尺度は質的データ,間隔尺度と比例尺度は量的データと称 される.これらの統計的尺度はそれぞれ許容される演算が異なることから,それぞれの尺 度で測定されたデータに適した統計量およびデータの可視化の方法がある.本稿ではこれ らの方法について概観した.また,言語データの多くが質的データであり,このようなデ ータについて統計的なアプローチを行うために留意しなくてはならないことを述べた. | 100-109 | |||||||||||||||||
15 | English | Vol. 33, No.2 | September 20, 2021 | Tutorial | TSUCHIYAMA Gen | An Introduction to Statistics in Linguistics (2):
Statistical Scales and Linguistic Data | Statistics, Quantitative data, Qualitative data, Statistical scales, Visualization | Linguistic data are typically classified based on the nature of the values into one of four categories known as the nominal scales, ordinal scales, interval scales, and ratio scales. The nominal scales and ordinal scales are useful for qualitative data and the interval scales and ratio scales are useful for quantitative data. Since each of these statistical scales allows different calculations, there are different statistical and data visualization methods suitable to each scale. This paper gives an overview of these methods. In addition, given that the majority of linguistic data are qualitative, in this paper, we show that researchers must be careful when taking a statistical approach to such data. | 100-109 | |||||||||||||||||
16 | 日本語 | 33巻3号 | 2021年12月20日 | 論文A | 真田 治子 | 文の長さと節の長さの「自然な」均衡に関する研究― 翻訳文へのMenzerath–Altmann の法則の適用 ― | Menzerath – Altmann の法則,言語的要素の長さ,文,節,形態素,
翻訳,『星の王子さま』,回帰分析 | 文が内包する言語的要素の長さの均衡の様相を知るために,海外の計量言語学で研究に
多用されているMenzerath – Altmann の法則(MAL)の手法を用いて調査を行った.『星 の王子さま』の日本語訳2 版を資料として,節の数で数えた文の長さと,その構成要素で ある節を形態素の個数や文字数で計って関数とし,MAL の方程式を用いて回帰分析を行 った.Altmann が述べている通り,翻訳文においても文と節との関係は減少関数が得られ た.2 つの版の回帰曲線は互いに似た傾向が見られた.一方で,分布している実データに は減少関数から逸脱した箇所があり,添加や説明,挿入句,心内会話等を1 文に盛り込ん でいる例が見られた.これらは日本語らしい長さの均衡を意図的に崩し,表現上の効果を 狙ったものと考えられる. | 114-129 | |||||||||||||||||
17 | English | Vol. 33, No.3 | December 20, 2021. | Paper (A) | SANADA Haruko | A Study of the “Natural” Equilibrium between the Sentence and Clause Length:
Applying Menzerath–Altmann's Law to Translated Texts in Japanese | Menzerath–Altmann’s law, length of the linguistic elements, sentence, clause,
morpheme, translation, Le Petit Prince, regression analysis. | In order to understand balancing the lengths of linguistic elements contained in a sentence, we
conducted a survey using the Menzerath–Altmann's law (MAL), which is often used in quantitative linguistics research in Europe and Canada. Using texts from two editions of the Japanese translation of a French book, Le Petit Prince, as our study material, we construct a dataset to create a function with the length of the sentence measured by the number of clauses as x, the length of the clauses that constitute the sentence measured by the number of morphemes as y, and the number of characters as y’. The regression analyses were performed on the linguistic length dataset, employing the MAL equation. As Altmann stated, the association between the sentence length and clause length is expressed by a decreasing function. The MAL holds even in translated texts. The regression curves of the two editions tended to be similar to each other. However, some data deviated from the MAL decreasing function, specifically, for cases with additions, longwinded explanations, parenthetic expressions, or words expressing thoughts without quotations. It can be regarded that these cases are intended to have an expressive effect by means of breaking the balance of length among linguistic elements, which is typical in Japanese expressions. | 114-129 | |||||||||||||||||
18 | 日本語 | 33巻3号 | 2022年12月20日 | 論文A | 久屋 愛実 | 英語由来語彙を公共コミュニケーションでどう運用するべきか
―全国調査のデータを活用した福祉言語学的考察― | 英語由来の語彙,音訳借用,言語接触,公共コミュニケーション,社会言語学,地球語としての英語(English as a global language),福祉言語学(welfare linguistics),翻訳借用,ロジスティック回帰分析 | 本稿は,英語由来の語彙(外来語)が公共コミュニケーションにおいてどのように運用
されるべきか,福祉言語学の視点から論じる.そのために,ロジスティック回帰分析を援 用して,これまでに蓄積されてきた外来語に関する全国調査のデータを統合し,新たな視 点からの検討を行う.分析の結果,(1)音訳借用語を使うことに関する意識(音訳借用語 に対する「選好度」)は一般市民と自治体職員の間で異なること,(2)一般市民の音訳借用 語の「理解度」は当該語彙に対する「選好度」とは必ずしも一致しないことが確認された. これらの結果から,公共コミュニケーションの実践において情報発信者側が上記のデータ を解釈・活用する際に留意すべき点について考察した. | 130-145 | |||||||||||||||||
19 | English | Vol. 33, No.3 | December 20, 2021. | Paper (A) | KUYA Aimi | Towards the Effective Adoption of English Loanwords for Japanese Public Communication:A Welfare Linguistic Analysis of Data from National Surveys | English loanwords, homophonic translation, language contact, public communication, sociolinguistics, English as a global language, welfare linguistics, loan translation, logistic regression analysis | The present research, conducted from a viewpoint of welfare linguistics, discusses the manner in which loanwords from English should be adopted for public communication in Japan. It explores a new approach to interpreting data from national surveys on loanwords from English using logistic regression analysis. The analysis reveals that there is often a discrepancy between the general public and regional government workers in the level of preference for the adoption of homophonic translation (a phonetic equivalent of the English word in katakana). It also reveals that the general public’s level of comprehension, or literacy, of a certain homophonic translation cannot be identified with their level of preference for the adoption of that word. These findings suggest that better public communication could result if those who publish announcements, e.g. regional government workers, take these issues into consideration. | 130-145 | |||||||||||||||||
20 | 日本語 | 33巻3号 | 2021年12月20日 | 論文A | 今田 水穂 | 児童作文における語彙多様性の評価 | 児童作文,語彙多様性,線形混合モデル | 児童作文を用いて,24 種類の語彙多様性指標の信頼性を調べた.語彙多様性指標は延べ 語数と無相関であることが望ましいが,児童作文の場合は著者の作文能力に応じて語彙多 様性と延べ語数の間に相関が見られるため,集団全体で指標値と延べ語数が無相関である ことは指標の信頼性の根拠にならない.そのため,同一作文中において累積的に指標値を 測定し,その変動の小ささをLMMで評価した.また,指標値の分布の形状を指定するパ ラメータを用いる3 種類の指標について,LMM でパラメータを決定する補正を試みた. この結果,Simpson 指数,実測的手法,LMMで補正した指標で比較的よい結果が得られ た.これらの指標について著者の学年,および教員による作文評価(語彙評価)との関係 を調べ,学年が上がるほど語彙多様性が増大すること,教員の評価において語彙多様性は それほど重視されていないことを確認した. | 146-161 | |||||||||||||||||
21 | English | Vol. 33, No.3 | December 20, 2021. | Paper (A) | IMADA Mizuho | Evaluation of Lexical Diversity in Children’s Writing | children’s writing, lexical diversity, linear mixed model | We examined the reliability of 24 different lexical diversity indices using children’s compositions. It is desirable that the lexical diversity index is uncorrelated with the text length, but in the case of children’s writing, uncorrelatedness does not ensure the reliability of the index because children’s language ability is correlated with both the text length and the lexical diversity. Therefore, we measured indices cumulatively in the same composition, and evaluate the smallness of its variation by LMM. In addition, we attempted to modify three types of indices by using LMM to determine its parameter. It showed that the Simpson indices, the iterative measurement methods, and the LMM-corrected indices gave relatively good results. We also examined the relationship of these indices to the author’s grade level and the teacher’s evaluation of their writing, and it was confirmed that lexical diversity increased as the grade level increased and that the teacher’s evaluation did not place much importance on lexical diversity. | 146-161 | |||||||||||||||||
22 | 日本語 | 33巻3号 | 2021年12月20日 | 論文A | 菅野 倫匡, 菊池 そのみ | 和歌集における品詞の構成比率の算出方法に関する試論
―計量語彙論のための標本抽出法を中心に― | 計量語彙論,和歌,品詞の構成比率,標本抽出,サンプリング,単純無作為抽出法,集落抽出法 | 計量語彙論においては品詞の構成比率に着目した研究が進められてきた.しかし,品詞 の構成比率は算出方法によって異なるものであるにも拘わらず,それによってどの程度の 差が生ずるかという点は顧みられてこなかった.この点について本稿は和歌を対象として 言語単位の問題,本文の問題,標本抽出の問題の3 つの側面から実証的に検討するもので ある.まず,2 つの言語単位を用いて品詞の構成比率を比較すると両者の間に無視し難い 差が見られた.次に同一の和歌集の2 つの本文を用いて比較すると両者の間に大きな差は 認められなかった.続いて標本調査の結果と全数調査の結果とを比較すると統計的な誤差 は見られるものの結論を揺るがすような差は認められなかった.更に標本調査の結果から 和歌集全体の品詞の構成比率を推定する際には集落抽出法によって和歌を抽出する方法 が単純無作為抽出法によって語を抽出する方法に比して精度の面で優ることが示された. | 162-177 | |||||||||||||||||
23 | English | Vol. 33, No.3 | December 20, 2021. | Paper (A) | KANNO Michimasa KIKUCHI Sonomi | A Tentative Study on How to Calculate the Proportions of Parts of Speech in Japanese Poetry Collections: An Emphasis on the Sampling Methods for Quantitative Lexicology | quantitative lexicology, waka, Japanese poetry, proportions of parts of speech, statistical sampling, simple random sampling, cluster sampling | There has been much research on the proportions of parts of speech in the field of quantitative lexicology. However, the issue of how much variation can occur when applying different calculation methods has not been considered, even though the proportions of parts of speech depend on them. Using waka poetry data, this study empirically examined the differences in proportion for each calculation method in terms of three issues: word unit, variant texts, and statistical sampling. The examination showed that the proportions determined by two different word units had considerable differences, while the proportions calculated using two variant texts of the same waka collection did not change substantially. Moreover, compared to the proportions in the complete survey, the proportions in the sample survey identified statistical errors, but the differences did not change the overall conclusion. Furthermore, when the proportions for the entire waka collection were estimated from the sample proportions, it was revealed that the sampling pieces of waka using cluster sampling yielded unexpectedly better results in terms of the statistical precision than the sampling words using simple random sampling. | 162-177 | |||||||||||||||||
24 | 日本語 | 33巻3号 | 2021年12月20日 | 論文B | 加藤 祥, 浅原 正幸 | IPAL 用言例文への印象評定情報付与と代表義・典型用例の抽出 | IPAL,多義語,代表義,印象評定,質問紙調査 | 用例中の多義語の語義が,一般的な読み手によってどのように認定される傾向にあるの か,印象評定を用いた調査を試みた.計算機用日本語基本辞書IPAL に含まれる用言(形容 詞・形容動詞・最重要動詞,計530 語)全文型の例文(5,125 例)に対し,文や用法に関 する読み手の印象評定,分類語彙表番号と山崎・柏野(2017)の代表義情報を付与した. 多義語の語義における代表義と印象評定を対照し,代表義の印象傾向を分析した.また, 各用例の代表義を算出することで,見出し語における読み手が典型的と考える用例を抽出 した.読み手の印象評定傾向から,助詞をはじめとする周辺語彙の差異により想起される 文脈が異なること,文脈情報が用例の意味認定に関わる可能性を考察する. | 178-193 | |||||||||||||||||
25 | English | Vol. 33, No.3 | December 20, 2021. | Paper (B) | KATO Sachi ASAHARA Masayuki | Impression Rating Evaluation of Example Sentences for Verbs and Adjectives in the IPAL Dictionary: Their Representative Senses and Typical Usages | IPAL, polysemous, representative sense, impression rating, questionnaire study | We performed large-scale impression rating experiments to investigate the evaluation of the senses of polysemous words in example sentences. For the impression rating, we used 5,125 example sentences for 530 words in the IPA Lexicon of Basic Japanese Verbs, Adjectives, and Nouns (IPAL). In addition, we annotated the sense tags of Word List by Semantic Principles and their representative senses given by Yamazaki and Kashino (2017). A contrastive survey between the representative senses and impression ratings was performed. Further, linear regression analysis was performed to estimate the degree of representativeness and extract their typical usages. We found that differences in contextual words, including case particles, affect the recognition of word senses. | 178-193 | |||||||||||||||||
26 | 日本語 | 33巻3号 | 2021年12月20日 | 研究資料 | 中俣 尚己
小口 悠紀子 小西 円 建石 始 堀内 仁 | 自然会話コーパスを基にした『話題別日本語語彙表』 | 話題と語彙,日本語教育,話し言葉,『名大会話コーパス』,特徴語, 特徴話題,機能語 | 本稿では会話コーパスを基に作成した『話題別日本語語彙表』についてその作成方法と 利用方法を解説する.本語彙表を作るために,まず「名大会話コーパス」を複数の作業者 で目視し,話題ごとにサブコーパスに分割した.次に,サブコーパスごとに対数尤度比を 計算し,列に97 の話題,行に3,324 語を並べたエクセル形式の表を作り上げた.『話題別 日本語語彙表』は「話題から語」,「語から話題」の2 方向で日本語教育の現場で活用でき る.前者ではその話題でよく使われている語をリストアップすることができ,機能語や言 語行動なども見つけることができる.後者では類義語がそれぞれに使われている話題が違 うことに気づいたり,機能語にも使用される話題に偏りがあることを知ることができる. | 194-204 | |||||||||||||||||
27 | English | Vol. 33, No.3 | December 20, 2021. | Resource | NAKAMATA Naoki KOGUCHI Yukiko KONISHI Madoka TATEISHI Hajime HORIUCHI Hitoshi | Compilation of “Topic-Vocabulary for Japanese Language Education” from a Corpus of Natural Conversation | Topic and Vocabulary, Japanese Language Education, Speaking, "Nagoya University Conversation Corpus", Specific Word, Specific Topic, Function Word | This article describes how to create and use the “Topic-Vocabulary Table for Japanese Language Education” which was elaborated based on a conversation corpus. To create this table, several workers manually checked and divided the “Nagoya University Conversation Corpus” into subcorpora for each topic. Then, log-likelihood ratios were calculated for each sub-corpus. Finally, an Excel table was created with 97 topics arranged horizontally and 3,324 words arranged vertically. This table can be used for Japanese language education in two directions: from topic to word, and from word to topic. In the former, users can learn function words and language behaviors in addition to frequently used words in the topic. In the latter, users can notice that synonyms are frequently used in different topics for each, as well as a bias in the topics in which functional words are used. | 194-204 | |||||||||||||||||
28 | 日本語 | 33巻3号 | 2021年12月20日 | 解説 | 中俣 尚己 | 言語統計学入門(3)
―パーセンテージと比率― | 割合,情報の圧縮,小数点,グラフ,パーセントポイント,pmw | 数値データを比率を用いて表すことは広く行われているが,それゆえに不適切な利用も
目立つ.本稿では比率をパーセントで表示する意義とその際の注意点についてまとめた. まず,パーセントを内訳として使用する際には,100 を超えるデータの情報を圧縮して示 しているということに留意が必要である.非常に少ないデータをパーセントで表示したり, 小数点以下の値を細かく記述することは不適切な利用である.また,比率を用いて異なる 母数のデータを比較するときは何に対する比率であるかを意識することが重要である.パ ーセント表示された値の差はパーセントポイントという単位を使って示さなければなら ない.また,パーセント以外の比率の単位も存在する.コーパス言語学で用いられるpmw という単位についても紹介した. | 205-213 | |||||||||||||||||
29 | English | Vol. 33, No.3 | December 20, 2021. | Tutorial | NAKAMATA Naoki | An Introduction to Statistics in Linguistics (3):
Percentages and Ratios | Proportion, Compression of information, Decimal Point, Graph, Percentage Point,
PMW | Though percentages are widely used to express ratios of numerical data, occasionally, they are
inappropriately used. This article summarizes the significance of percentages and important points to bear in mind when using them to express ratios. First, when using percentages in a breakdown of data, it is important to bear in mind that percentages compress information on the numbers of instances when the size of the dataset is greater than 100. Thus it is inappropriate to use percentages with very small datasets or to give more decimal places than precision warrants. When using ratios to compare data for different populations, it is important to be aware of what the ratios are for. Also, a difference in values expressed as a percentage should not be expressed by a percentage itself, but by percentage points. Finally, this article introduces units of ratios other than percentages, including per million words (PMW), which is widely used in corpus linguistics. | 205-213 | |||||||||||||||||
30 | 日本語 | 33巻3号 | 2021年12月20日 | 学会参加報告 | 真田 治子 | QUALICO 2021(国際計量言語学会大会)― 2021 年9 月9 日~11 日,於オンライン― | 214-218 | |||||||||||||||||||
31 | English | Vol. 33, No.3 | December 20, 2021. | Conference Report | SANADA Haruko | QUALICO 2021 International Quantitative Linguistics Conference held online from September 9 to 11, 2021 | 214-218 | |||||||||||||||||||
32 | 日本語 | 33巻4号 | 2022年3月20日 | 特集・招待論文 A | 金愛蘭 | 現代「語彙史」研究のためのコーパスと統計―『毎日新聞経年コーパス』による語の増減傾向の分析― | 語彙史,語彙調査,経年コーパス,リジット解析,増加傾向得点 | 語の集合としての「語彙」の歴史的な変化,すなわち「語彙史」を記述するためには, そのためのコーパスを用意する必要がある.また,それを利用して有意味な変化の傾向を 見出すためには,用いる統計手法についても工夫する必要がある.本稿では,筆者がこれ まで作成・増補してきた(20世紀半ば以降の)『毎日新聞』の経年的なコーパスについて, その内容と特徴とを紹介するとともに,同コーパスにおける語の増減傾向の分析を,従来 とは異なる統計手法の適用によって試みた結果を報告する. | 233-248 | |||||||||||||||||
33 | English | Vol. 33, No.4 | March 20, 2022. | Invited Paper (A) | KIM Eran | Corpus and Statistics for the Study of the History of Modern Japanese Vocabulary: An Analysis of the Increase/Decrease of Word Usage Using the Diachronic Corpus of Mainichi Shimbun | history of vocabulary, word count, diachronic corpus, ridit analysis, increase/decrease of word usage | n order to describe the historical changes of "vocabulary" as a set of words, it is necessary to prepare a corpus for this purpose. It is also necessary to devise statistical methods to find significant trends of change using the corpus. In this paper, I introduce the contents and characteristics of the diachronic corpus of the Mainichi Shimbun since the mid-20th century, which I have created and expanded, and report the results of my analysis of the increase and decrease of word usage in the corpus using ridit analysis. | 233-248 | |||||||||||||||||
34 | 日本語 | 33巻4号 | 2022年3月20日 | 論文 A | 田中ゆかり,前田忠彦,林直樹,相澤正夫 | 1 万人を対象とした全国方言意識 Web 調査に基づく話者類型 | 方言意識,潜在クラス分析,話者類型,地域差,年代差 | 2015年に実施し全国の20歳以上の男女約1万人から回答を得た方言意識Web調査 (2015年全国方言意識Web調査)のデータを用い,潜在クラス分析によって話者類型を 抽出し,各類型の特徴記述とその解釈を試みた.抽出された七つの話者類型をクラスサイ ズ降順に示すと,「消極的使い分け派」「積極的方言話者」「積極的使い分け派」「方言育ち 共通語話者」「共通語話者」「判断逡巡派1」「判断逡巡派2」となる.帰属確率平均値に着 目すると,クラスサイズの大きな主要5類型には,明らかな地域と年代の効果が認められ た.地域の効果は現代日本語社会における方言と共通語に対する意識の地域差,年代の効 果は戦後日本語社会を構成する話者の意識が,「方言育ち共通語話者」から「共通語話者」 「積極的方言話者」へと変遷したことを映すものと解釈する. | 249-264 | |||||||||||||||||
35 | English | Vol. 33, No.4 | March 20, 2022. | Paper (A) | TANAKA Yukari MAEDA Tadahiko HAYASHI Naoki AIZAWA Masao | Speaker Typology Based on a Nationwide Web Survey of Dialect Consciousness among 10,000 People in Japan | dialect consciousness, latent class analysis, speaker typology, regional differences, age group differences | Using data from the 2015 nationwide web survey on dialect consciousness, which was conducted in 2015 and received responses from approximately 10,000 males and females aged 20 and older nationwide, we extracted speaker types using latent class analysis (LCA) and attempted to describe and interpret the characteristics of each type. The seven speaker types extracted by the LCA, in descending order of class size, are: (1) ‘moderate code switchers (between common language (CL) and dialect)’, (2) ‘active dialect speakers’, (3) ‘active code switchers’, (4) ‘CL speakers who grew up in dialect environment’, (5) ‘CL speakers’, (6) ‘indecisive respondent type1’, and (7) ‘indecisive respondent type2’. In terms of the average membership probability, clear regional and age group effects are found among the five major types with large class sizes. The regional effects are interpreted to indicate the regional differences in the consciousness of dialect and CL in contemporary Japanese society, and the age group effects are interpreted to reflect the transition in the consciousness of speakers in postwar Japanese society from ‘CL speakers who grew up in dialect environment’ to ‘CL speakers’ and ‘active dialect speakers’ | 249-264 | |||||||||||||||||
36 | 日本語 | 33巻4号 | 2022年3月20日 | 論文 B | 鈴木陽子 | 親子談話における自他対応動詞 5 対の使用頻度の比較 | 動詞習得,自動詞,他動詞,使用頻度,親子談話 | 本研究は,1歳〜3歳の子どもと母親の自然発話データを対象に,5対の自他対応動詞 (「入る-入れる」「乗る-乗せる」「出る-出す」「壊れる-壊す」「開く-開ける」)に焦 点を当て,それぞれの動詞について,初期に獲得される6つの形態素(「る」(非過去), 「た」(過去),「て」(命令),「ちゃう」(完成相),「ない」(否定),「ている」(継続相)) と組み合わされる頻度を比較した.t検定の結果,自動詞と他動詞の総使用頻度には有意 な差がみられないが,4つの形態素(「る」,「た」,「ない」,「ている」)について自動詞の 方が有意に高い頻度で使用されていた.この傾向は子どもと母親の双方にみられ,子ども の動詞使用が母親からの入力によって影響を受けていることが示唆される.また,自動詞 と他動詞の使用頻度の相関係数が高いことから,自他対応動詞の対の使用頻度における関 連性を示した. | 265-280 | |||||||||||||||||
37 | English | Vol. 33, No.4 | March 20, 2022. | Paper (B) | SUZUKI Yoko | A Study of Verb Forms of Five Japanese Transitive and Intransitive Verb Pairs in Parent-Child Discourse | verb learning, transitive verb, intransitive verb, frequency, parent-children discourse | This study focuses on five Japanese transitive and intransitive verb pairs (hairu “enter,” ireru “put in,” noru “get on,” noseru “put on,” kowareru /kowasu “break,” and aku /akeru “open,”) and compares the frequency of verb forms that contain six morphemes (-ru (non-past), -ta (past), -te (imperative), -chau (perfective), -nai (negative), and -teiru (continuous)) in spontaneous speech data of children age 1-3 years old their mothers. Although there was no significant difference in the overall frequency of user between intransitive and transitive verbs, intransitive verbs were used significantly more frequently with four morphemes (-ru, -ta, -nai, and -teiru). This trend was observed for both children and mothers, suggesting that children’s verb use is influenced by input from their mothers | 265-280 | |||||||||||||||||
38 | 日本語 | 33巻4号 | 2022年3月20日 | 書評 | 尾崎誉治 | 金明哲(2021)『テキストアナリティクス1 テキスト
アナリティクスの基礎と実践』岩波書店 | 281-285 | |||||||||||||||||||
39 | 日本語 | 33巻4号 | 2022年3月20日 | 解説 | 林直樹 | 言語統計学入門(4)平均値に差があるのかないのか | 平均値,t検定,一元配置分散分析,多重比較 ,NHKニュース, 文の長さ,鶴岡調査,共通語音声 | 本稿では,言語データの平均値に差があるのかどうかを確認する際の統計的手法につい て概説する. まず,平均値の定義や適用事例について概説した後,言語研究分野における平均値の適 用事例について述べる. 続いて,統計的手法に基づく平均値の比較方法としてt検定と一元配置分散分析を取り 上げ,その計算法を示すとともに,実際のデータに基づき分析していく. | 286-299 | |||||||||||||||||
40 | English | Vol. 33, No.4 | March 20, 2022. | Tutorial | HAYASHI Naoki | An Introduction to Statistics in Linguistics (4): Comparison of Means | mean, t-test, one-way ANOVA, multiple comparison, NHK news, length of sentence, survey in Tsuruoka, standardization of segmental phonemes | This paper outlines a statistical method for checking whether there are differences in the mean values of linguistic data. First, I will give an overview of the definition and applications of mean value. Then, I will discuss some applications of mean values in the field of linguistic research. Second, I will discuss t-test and one-way ANOVA as methods of comparing means based on statistical methods, show how to calculate them, and analyze them based on actual data. | 286-299 | |||||||||||||||||
41 | 日本語 | 33巻5号 | 2022年6月20日 | 論文 A | 李広微,金明哲 | 現代小説の文末表現における通時変化の統計モデリングと 分析 | 文末表現,通時変化,K 特性値,ランダムフォレスト,特徴的変数 | 本研究では,現代小説における文末表現について機械学習の方法でモデリングし,どの
ような項目に顕著な変動が見られるかについて考察を行った.具体的には,1910 年から 2014 年までに出版された小説のコーパスを構築し,文末表現のデータを抽出して分析に 用いた.まず,語彙的豊富さの指標を利用して文末の多様性の変化を調査した.そして, 文末表現に関するモデルを構築し,モデル構築に大きく寄与する項目を抽出して考察を加 えた.分析の結果,時期の推移に伴い,文末表現がより多様になってきたことが明らかに なった.そして,統計モデリングにより,小説の語り方や技法の変化を示唆する特徴的な 傾向が見出された. | 309-324 | |||||||||||||||||
42 | English | Vol. 33, No.5 | June 20, 2022. | Paper (A) | LI Guangwei , JIN Mingzhe | Statistical Modeling and Analysis of Diachronic Changes in Sentence- final Expressions in Modern Novels | sentence-final expression, diachronic change, characteristic' K, random forest, characteristic variables | In this study, we applied a machine learning method to model the sentence-final expressions in modern Japanese novels, and examined what kind of items exhibit remarkable fluctuations. Our experiments were conducted on a diachronic corpus consisting of contemporary novels published from 1910 to 2014. Sentence-final expression data were extracted from the corpus and used for analysis. First, we investigated changes in the diversity of sentence-final expressions using the index of vocabulary richness. Then, we constructed modeling related to sentence-final expressions, and extracted the instrumental items playing important roles in model construction. The results showed that the sentence-final expressions became more diverse with time. Furthermore, statistical modeling revealed characteristic tendencies suggesting changes in the narrative methods and techniques of novels. | 309-324 | |||||||||||||||||
43 | 日本語 | 33巻5号 | 2022年6月20日 | 論文 A | 李文平,劉海濤,熊子涵 | 日本語における語順の自由度と格標識の豊富さに関する計量的研究 | 語順の自由度,格標識の豊富さ,文章ジャンル,量的指標 | 本研究では,「現代日本語書き言葉均衡コーパス」のコアデータに対する文節係り受け・ 並列構造情報のデータを利用し,6つの文章ジャンルにおける語順の自由度,格標識の豊 富さ及び両者の相関を定量的に分析した.その結果,次の三点が明らかになった.第一に, 語順の自由度は白書,Yahoo!ブログ,Yahoo!知恵袋,新聞,雑誌,書籍の順に高くなる傾 向が見られた.第二に,格標識の豊富さはYahoo!ブログ,Yahoo!知恵袋,新聞,雑誌,書 籍,白書の順に高くなることが明らかになった.第三に,白書以外の5つの文章ジャンル において,語順の自由度と格標識の豊富さの間に正の相関関係が見られた.本研究では, 日本語の語順の自由度と格標識の豊富さとの関係を初めて定量的に分析した.本研究の結 果は統語と形態との関係の面,及び言語普遍性の面から日本語をより深く理解するために 役立つと考えられる | 325-340 | |||||||||||||||||
44 | English | Vol. 33, No.5 | June 20, 2022. | Paper (A) | LI Wenping, LIU Haitao, XIONG Zihan | A Quantitative Study of Word Order Freedom and Case Marking Richness in Japanese | word order freedom, case marking richness, text genre, quantitative metrics | In this study, we use Balanced Corpus of Contemporary Written Japanese with annotations of predicate-argument structures to quantify word order freedom, case marking richness, and the correlation between the two in six text genres. The results of the study clarified the following three findings. Firstly, it was found that the word order freedom tended to increase in the order of white papers, Yahoo! Blogs, Yahoo! Chiebukuro, newspapers, magazines and books. Secondly, it was clarified that the case marking richness increases in the order of Yahoo! Blogs, Yahoo! Chiebukuro, newspapers, magazines, books and white papers. Thirdly, it was revealed that a positive correlation was found between word order freedom and case marking richness in five text genres other than white papers. This research is the first to quantitatively analyze the relationship between word order freedom and case marking richness in Japanese. The results of this study will be useful for a deeper understanding of Japanese in terms of the relationship between syntax and morphology, and in terms of language universals. | 325-340 | |||||||||||||||||
45 | 日本語 | 33巻5号 | 2022年6月20日 | 書評 | 鯨井綾希 | 髙崎みどり(2021)『テクスト語彙論 ― テクストの中でみることばのふるまいの実際 ―』ひつじ書房 | 341-345 | |||||||||||||||||||
46 | 日本語 | 33巻5号 | 2022年6月20日 | 書評 | 林雅子 | 前川喜久雄監修,伝康晴,荻野綱男編(2019)『講座日本語コーパス 7 コーパスと辞書』朝倉書店 | 346-350 | |||||||||||||||||||
47 | 日本語 | 33巻5号 | 2022年6月20日 | 解説 | 入江さやか | 言語統計学入門(5)比率に差があるのかないのか | 標本,母集団,母比率,カイ二乗検定,カイ二乗値 | 言語を量的に分析する際は,コーパス調査やアンケート調査を行い,語・品詞・語種・ 字種・共起語,「はい」と答えた人数,など様々な調査項目の頻度から比率を求め,その 差を用いて違いを述べることが多い.しかし,コーパス調査やアンケート調査は,全数調 査でなく,標本調査であることがほとんどである.標本調査で得た比率を母集団の比率と 同等に扱ってはいけない.また,比率で比較する場合でも,標本サイズは必ず記さなけれ ばならない.10/50と20/50の比率と,4/20と8/20の比率はともに前者20%,後者40% で同じで,比率の差は20ポイントであるが,後者の場合は,実質的な意味のある差では ない.分母,すなわち標本サイズが重要である.本稿では,いくつかの具体例を計算式と 共に示しながら,比率に差があるのかないのかについて注意すべき点について述べる.統 計的な説明は最小限にとどめ,四則演算と平方根の知識で理解できる計算式で示す. | 351-361 | |||||||||||||||||
48 | English | Vol. 33, No.5 | June 20, 2022. | Tutorial | IRIE Sayaka | An Introduction to Statistics in Linguistics (5) Whether There is a Difference in the Proportion | sample, population, population proportion, chi-squared test, chi-squared value | Quantitative analysis of language is often stated using the difference of the proportion calculated from frequency of various survey items such as words, part of speech, etymological types, character types, co-occurrence words, and the number of people who answered "yes", by corpus surveys and questionnaire surveys. However, most corpus surveys and questionnaire surveys are sample surveys, not complete surveys. The proportion obtained from the sample survey should not be treated the same as the proportion of the population. Also, even when comparing proportions, the sample size must be stated. The ratio of 10/50 and 20/50 and the ratio of 4/20 and 8/20 are the same for the former 20% and the latter 40%, and the difference in ratio is 20 points, but in the latter case, it is not a statistically meaningful difference. In this paper, while showing some concrete examples together with the calculation formulas, we describe the points to be noted about whether there is a difference in the proportion. The statistical explanation is kept to a minimum, and it is shown by a calculation formula that can be understood by knowledge of four arithmetic operations and square roots. | 351-361 | |||||||||||||||||
49 | 日本語 | 33巻6号 | 2022年9月20日 | 論文B | 大島英之 | 中世における呉音漢音混読現象の展開 ―『色葉字類抄』と『日葡辞書』の漢語語形の比較を通じて― | 日本漢字音,漢語,呉音,漢音,漢字音の一元化,色葉字類抄,日葡辞書 | 現代語では,言語(漢音ゲン+呉音ゴ)のように,呉音と漢音を混ぜ読み(以下「混読」と呼ぶ)する漢語は多くあるが,中世以前にはほとんどなく,後出の形とされている.しかし,特定の時代における混読の実態や,その通時的変遷については詳らかでない部分が多い.本稿では,呉音・漢音の音形が明らかに対立する漢字同士で構成される熟語を分母とした時の,呉音ないし漢音同士で読まれる漢語に対する,混読される漢語の割合を,「混読率」と定義し,中世の両端に位置する辞書資料における混読率を求めた.その結果『色葉字類抄』の混読率は約15%,『日葡辞書』の混読率は約24%と求まり,中世において混読現象が拡大していることが明らかとなった.中世に混読が増加した背景については,二資料に共通する漢語の語形を比較した結果から,特定の漢字に呉音・漢音どちらか一方が固定化する「漢字音の一元化」の影響が大きいことを論じた. | 373-388 | |||||||||||||||||
50 | English | Vol. 33, No.6 | September 20, 2022. | Paper (B) | OHSHIMA Hideyuki | The Blending of Go-on and Kan-on in Medieval Japanese: Compared with Sino-Japanese Words Found in Iroha Jiruishō and Nippo Jisho | Sino-Japanese, Sino-Japanese words, Go-on, Kan-on, unification of Sino-Japanese readings, Iroha Jiruishō, Nippo Jisho | In modern Japanese, there are many Sino-Japanese words with two characters, one of which is read by Go-on and the other by Kan-on, such as gengo (gen is Kan-on and go is Go-on). It has been remarked that the blending of Go-on and Kan-on scarcely occurred until the medieval period. To quantitatively confirm this perspective, this study classified Sino-Japanese words with two characters, of which Go-on and Kan-on are explicitly distinct, into three categories, namely, Go-on, Kan-on, and blend reading words. The proportion of blend reading words to the other two words in Iroha Jiruishō (the Japanese dictionary compiled in the 12th century) is approximately 15%, and in Nippo Jisho (the Japanese–Portuguese dictionary compiled in 1603-04), it rises to approximately 24%. This result demonstrates that the blending of Go-on and Kanon increased during the medieval period. This study also pointed out that some examples of shifts between Go-on and Kan-on implies that the unification of Sino-Japanese readings, which means either Go-on or Kan-on becomes dominant for each character, influenced the spread of blending. | 373-388 | |||||||||||||||||
51 | 日本語 | 33巻6号 | 2022年9月20日 | 書評 | 高橋雄太 | 中俣尚己(2021)『「中納言」を活用したコーパス日本語研究入門』ひつじ書房 | 389-393 | |||||||||||||||||||
52 | 日本語 | 33巻6号 | 2022年9月20日 | 書評 | 蔡 薰婕 | 李在鎬(編)(2021)『データ科学×日本語教育』ひつじ書房 | 394-398 | |||||||||||||||||||
53 | 日本語 | 33巻6号 | 2022年9月20日 | 書評 | 今田水穂 | 田中久美子(2021)『言語とフラクタル-使用の集積の中にある偶然と必然-』 東京大学出版会 | 399-403 | |||||||||||||||||||
54 | 日本語 | 33巻6号 | 2022年9月20日 | 解説 | 間淵洋子 | 言語統計学入門(6)―出現数が多い/少ないとは― | 検定,帰無仮説,対立仮説,有意水準,正確二項検定,カイ二乗検定,フィッシャーの正確確率検定,粗頻度,相対頻度,調整頻度 | 言語研究における出現数の扱い方,評価について,母集団からの標本調査に基づく場合と,全数調査に基づく場合とに分け,数値計算の試行を交えて解説した. 標本調査における出現数の評価には,検定が有効である.言語調査では用例調査やアンケート調査等の分析でカイ二乗検定が多く用いられる.カイ二乗検定は,変数間の関係性を述べる際などに特に有効だが,標本サイズへの依存が大きく,期待値が極端に小さい場合や標本サイズが極端に大きい場合などには,正確な推定が難しい点に留意が必要である.一方,全数調査に基づく出現数の評価では,調査対象となった母集団全体の度数が重要である.古典語の資料間比較などでは,粗頻度ではなく母集団全体の度数をもとにした相対頻度を用いる必要がある. | 404-414 | |||||||||||||||||
55 | English | Vol. 33, No.6 | September 20, 2022. | Tutorial | MABUCHI Yoko | An Introduction to Statistics in Linguistics (6): How to Handle the Number of Occurrences | hypothesis testing, null hypothesis, alternative hypothesis, significance level, exact binomial test, chi-squared test, Fisher's exact test, raw frequency, relative frequency, adjusted frequency | This paper explains how the number of occurrences of forms in linguistic research can be handled and evaluated, dividing the cases into those based on sample surveys from a larger population and those based on complete surveys; trials of numerical calculations are included. There are numerous effective tests for evaluating the number of occurrences in a sample survey. In linguistic surveys, the chi-squared test is often used in the analysis of usage surveys and questionnaires. This test is particularly effective when describing relationships between variables; however, it is important to note that generating accurate results when the expected value is extremely small or when the sample size is extremely large is difficult because of the test’s strong sensitivity to the sample size. In contrast, in the evaluation of the number of occurrences in a complete survey, the frequencies with respect to the entire population surveyed are important. For inter-source comparisons of classical words, it is necessary to use relative frequencies based on the frequencies in the entire population, rather than raw frequencies. | 404-414 | |||||||||||||||||
56 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文A | 中俣尚己 | 並列を表す接続詞と文体―「まとめて検索KOTONOHA」を利用して― | コーパス,「中納言」,主成分分析,語の硬さ,自己表現性,公共性,発話の計画性,集合の形成動機 | この論文では,「中納言」の包括的検索システムである「まとめて検索KOTONOHA」を利用し,話し言葉5ジャンル,書き言葉5ジャンルにおける並列を表す接続詞の出現状況を分析した.結果に対し,主成分分析を行うことで10ジャンルの関係を可視化するとともに,各接続詞の特性についても分析した. 分析の結果,ジャンルは4つのクラスターに分けられ,「職場談話」と「模擬講演」,「名大会話コーパス」と「日本語日常会話コーパス」が近い文体的特徴を持つことがわかった.また,「学会講演」は「新聞」「国会会議録」と同じクラスターに入る.さらに,4つのクラスターに特徴的な接続詞のグループは,接続詞を意味・用法の観点から分析した先行研究における分類と対応することが確認された. | 422-434 | |||||||||||||||||
57 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (A) | NAKAMATA Naoki | A Stylistic Analysis of Coordinative Conjunctions: Using “Comprehensive Searching System: KOTONOHA” | Corpus, “Chuunagon”, Principal Component Analysis, Hardness of Words, Self-Expression, Public Announcement, Degree of Planning, Motivation of Grouping. | This article analyzes the occurrence of coordinative conjunctions in five spoken corpora and five written corpora by utilizing the “Comprehensive Searching System: KOTONOHA,” a function of the corpus searching web-application “Chuunagon.” Principal component analysis was conducted on the results of the corpus survey in order to visualize the relationship among 10 genres as well as to describe each conjunction. Consequently, 10 genres were divided into 4 clusters. “Workplace Conversation” and “Simulated Public Speaking” are in one cluster, while the two conversation corpus known as NUCC and CEJC belong to another cluster.. “Academic Presentation Speech” is in the same cluster as “Newspaper” or “Minutes of the Diet.” Furthermore, four groups of conjunctions which are specific to each cluster are found to correspond to the four groups of conjunctions in previous studies that analyzed conjunctions from the perspective of meaning and usage. | 422-434 | |||||||||||||||||
58 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文A | 馬場俊臣 | 「語の文体」と「文章の文体」―『語の文体値データ』を利用した「文章の文体」の推定― | 『語の文体値データ』,語の文体,文章の文体,文章文体値,書き言葉的,話し言葉的,硬い文体,軟らかい文体,BCCWJコアデータ | 本稿では,まず,多数の語の文体(書き言葉的な硬い文体-話し言葉的な軟らかい文体)の程度差を連続的な数値で示している『語の文体値データ』の概要を紹介した.次に,このデータの活用例として,「語の文体」に基づいて「文章の文体」を,「文章文体値」という数値を用いて推定することを試みた.推定に用いた文章は,『現代日本語書き言葉均衡コーパス』のコアデータであり,各レジスターの文体的特徴を再現することができた.これを通して,『語の文体値データ』及び「文章文体値」が文体研究に有効に使えるデータであること,また,「語の文体」と「文章の文体」との相互依存関係を計量的手法により実証的に分析可能であることを示した. | 435-450 | |||||||||||||||||
59 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (A) | BABA Toshiomi | On "Style of Word" and "Style of Text": Estimation of the "Style of Text" Using the "Data for Word Stylistic Value" | "Data for Word Stylistic Value", style of word, style of text, text stylistic value, written-like, spoken-like, hard style, soft style, BCCWJ core data | In this paper, we first presented an overview of the "Data for Word Stylistic Value" which shows continuous numerical values for the degree of stylistic differences (written hard style/spoken soft style) of many words. Subsequently, as an example of the use of this data, we attempted to estimate the "style of text" based on the "style of word" using a numerical value called the "text stylistic value." The texts used for the estimation were the core data of the "The Balanced Corpus of Contemporary Written Japanese" and were able to reproduce the stylistic characteristics of each register. Through this, we have shown that the "Data for Word Stylistic Value" and the "text stylistic value" can be used effectively for stylistic research, and that the interdependence between "style of word" and "style of text" can be empirically analyzed using quantitative methods. | 435-450 | |||||||||||||||||
60 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文A | 小林雄一郎, 岡﨑友子 | 日本語歴史コーパスを用いた指示代名詞の通時的分析 | 指示代名詞,通時的分析,日本語歴史コーパス,LOESS平滑化 | 本研究は,日本語歴史コーパスに収録された奈良時代から大正時代までのテキストを用いて,指示代名詞の通時的分析を行うものである.指示代名詞の形態は時代によって若干異なるため,系列別(コ系列,ソ系列,カ系列,ア系列),型別(ゼロ型,ノ型,レ型,コ型,ナタ型,チ型)の分類に基づく分析を行った.具体的には,系列別・型別に集計された頻度に対してLOESS平滑化を実行することで,指示代名詞の使用傾向の経年変化を調査した.そして,(1)指示代名詞の総数が増加していくこと,(2)ソ系列は増加傾向を示し,コ系列とア系列は1700〜1800年代に多く,カ系列は緩やかに減少したあとで再び増加すること,(3)ゼロ型は減少傾向,レ型は増加傾向を示し,ノ型は1700年以降に増加し,他の3つの型はいったん増加したあとで減少すること,などを明らかにした. | 451-465 | |||||||||||||||||
61 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (A) | KOBAYASHI Yuichiro, OKAZAKI Tomoko | A Diachronic Analysis of Demonstrative Pronouns Based on the Corpus of Historical Japanese | demonstrative pronouns, chronological variation, the Corpus of Historical Japanese, LOESS smoothing | The purpose of the present study is to explore the chronological variation of demonstrative pronouns using the Corpus of Historical Japanese. As the forms of demonstrative pronouns change with time, this study utilized the classification based on the word-initial (ko-, so-, ka-, and a-) and word-final forms (zero, -no, -re-, -ko, -nata, and -chi). The locally weighted (LOESS) smoothing regression was performed to investigate the frequency change patterns of these word forms from the Nara to the Taisho period in Japan. The results show that (1) the total number of demonstrative pronouns increased, (2) the so- form increased, the ko- and a- forms were frequent in the 1700s and 1800s, and the ka- form increased after 1800, and (3) the zero form decreased, the -re form increased, the -no form increased after 1700, and the -ko, -nata, and -chi forms decreased in the early modern period after an increase in the Edo period. | 451-465 | |||||||||||||||||
62 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文A | 岸本千秋 | SNSの文体をとらえる試み―ブログとTwitterを例に― | ブログ,Twitter,ウェブ記号,品詞比率,字種比率,ロジット変換 | ブログとTwitterを対象として文体の特徴を明らかにした.ブログについては,品詞比率,語種比率の結果から,きわめて話しことば的であることを確認した.Twitterについては,品詞比率からは書きことばに近いととらえられるが,これは,字数制限が影響しているとの解釈が妥当であるとした.Twitterの語種比率では,和語の値が高く,話しことば的な俗語,書き手の感情や状況を強調して表す語,物事に対する評価などを表す語が上位にランクインした.また,ウェブ記号が文体にどのような影響を及ぼすかについて,ウェブ記号がある文とない文との品詞比率の差をロジット変換によって再表現した結果,ブログもTwitterも,ウェブ記号がある文は形容動詞・感動詞について,ウェブ記号がない文は,連体詞・接続詞についてより大きく評価された. | 466-480 | |||||||||||||||||
63 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (A) | KISHIMOTO Chiaki | An Attempt to Clarify the Characteristics of the Style of Social Networking Service: In the Case of Weblog and Twitter | weblog, Twitter, web mark, ratio of parts of speech, ratio of parts of lexical stratification, logit transformation of data | The purpose of this paper is to clarify the characteristics of the style of weblog and Twitter. The results of the examination of the ratio of parts of speech and the ratio of parts of lexical stratification of weblog confirm that the style of weblog is extremely close to that of spoken language. In the case of Twitter, its style is, based on its ratio of parts of speech, considered to be similar to that of the written language. But it is reasonable to interpret this as an effect of the limited number of letters and characters used there. As concerns the ratio of parts of lexical stratification of Twitter, the ratio of native Japanese words ranks higher: Colloquial or slang words, words that emphasize the writer's feelings, or words that evaluate things are used frequently. The effect of web mark in the style was reexamined by logit transformation of data, and its result showed that in both weblog and Twitter, sentences with web mark were highly rated for adjectival nouns and interjections, while sentences without web mark were highly rated for prenoun adjectivals and conjunctions. | 466-480 | |||||||||||||||||
64 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文A | 土山玄 | 夏目漱石の小説における文体の継時的変化について―文末表現についての計量的な検討― | 計量文献学,夏目漱石,ランダムフォレスト,主成分分析,回帰分析 | 本研究の目的は,夏目漱石の小説において,出現傾向が継時的に変化する文体的特徴を明らかにすることである.夏目漱石は1905年から1916年まで作家として活動しており,本研究ではその間に発表された23作品を分析対象として採り上げた.ただし,会話文や書簡文は分析から除き,地の文のみを対象とした.分析ではランダムフォレスト,主成分分析,線形回帰分析を行った.その結果,文末表現が継時的に変化していることを明らかにした.特に,文末に用いられる助動詞の「た」は増加傾向にあることを示した. | 481-492 | |||||||||||||||||
65 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (A) | TSUCHIYAMA Gen | A Quantitative Analysis of Chronological Changes in Writing Style in Soseki Natsume's Novels: About Sentence-Final Expressions | Stylometry, Soseki Natsume, Random forest, principal component analysis, regression analysis | In this study, we analyzed the stylistic changes in sentence endings in novels by Soseki Natsume. Random forest, principal component analysis, and linear regression analysis were used to analyze the incidence of words appearing at the end of the sentences. Results showed that a change in the quantitative features of sentence endings occurred around 1908. In particular, seven works after "Sorekara," published in 1909, showed a similar trend. In addition, a consideration of eigenvectors in the principal component analysis revealed that the stylistic change in sentence endings recognized in 1908 was a marked increase in the use of the auxiliary verb "ta." | 481-492 | |||||||||||||||||
66 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・論文A | 井関龍太,菊池理紗,望月正哉,福田由紀,石黒圭 | 品詞構成に基づく文体指標は読者の印象とどのように関わるか―MVRと品詞構成率の心理学的検討― | 文体,品詞構成,MVR,主観的印象,文章心理学 | 日本語の文章の文体特徴を品詞構成の観点から計量化した指標としてMVR(Modifier-Verb Ratio)が広く用いられている.このような指標によって捉えられた特徴は,読者が文章を読んで抱く印象とどのように関わるのだろうか.本研究では,MVRおよび品詞構成率と主観的印象との関係を質問紙調査によって検討した.マルチレベルモデルによる分析の結果,名詞率と動詞率は登場人物や場面のイメージしやすさの印象に負の影響を及ぼすが,形容詞・副詞類の割合はイメージしやすさに寄与しなかった.文ごとの品詞構成率を説明変数とすることによって品詞間の交互作用が明らかになり,形容詞・副詞類が多いほどイメージが浮かびやすくなるのは特定の品詞構成の組み合わせが成立した特殊な場合であることが示唆された.一方,展開の早さの印象については,本研究で扱った範囲では有望な説明変数を見出せなかった.品詞構成と文体の印象との関係について考察し,文ごとの品詞構成に着目することの意義,分析概念の再考について論じた. | 493-509 | |||||||||||||||||
67 | English | Vol. 33, No.7 | December 20, 2020 | Paper (A) | ISEKI Ryuta, KIKUCHI Risa, MOCHIZUKI Masaya, FUKUDA Yuki, ISHIGURO Kei | Relationship Between Part-of-Speech-Based Stylistic Indicators and Subjective Impressions: Psychological Study of MVR and Part-of-Speech Composition | stylistics, part-of-speech composition, MVR, subjective impression, psychostylometry | The Modifier-Verb Ratio (MVR) is a widely used index for assessing stylistic features of Japanese texts in terms of part-of-speech composition. It is unclear how such elements are related to impressions resulting from reading a text. A questionnaire survey examined the relationship between MVR/part-of-speech rates and subjective impressions. Multilevel analysis indicated that noun and verb rates negatively affected imaginability, which was not the case for the modifier rate. We found an interaction between different types of part-of-speech by replacing the part-of-speech rates with the mean part-of-speech rates of sentences, which suggested that the more adjectives authors use, the easier it is for readers to imagine the scene depicted by texts, but only in that specific part-of-speech compositions. On the other hand, we did not find any promising explanatory variables for the impression of the speed of an unfolding story. We have discussed the relationship between part-of-speech composition and stylistic impressions, the significance of focusing on the part-of-speech composition of sentences, and reexamined the working definition based on this discussion. | 493-509 | |||||||||||||||||
68 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文B | 大川孔明 | 中世前期の文学作品の文体類型―叙述語を指標に― | 和漢の文体対立,和文,漢文訓読文,ジャンル文体,コレスポンデンス分析,クラスター分析 | 本稿では,叙述語を指標に,コレスポンデンス分析,クラスター分析を用いて鎌倉時代の和文作品,並びに和漢混淆文の一種とされる軍記物作品の文体が類型的にどのように位置づけられるのかについて,大川(2020)の結果との比較から考察した.その結果,鎌倉和文は紀行文和歌集型と強紀行文和歌集-和文体型に分けられ,さらに大川(2020)にて強紀行文和歌集型とされた『海道記』は強紀行文和歌集-漢文訓読文寄りの文体型に位置づけられること,軍記物は物語日記-漢文訓読文寄りの文体型に位置づけられ,『今昔物語集』などの作品と,和漢の文体対立から見たときにも,ジャンル文体から見たときにも概ね同様の文体的特徴を有することが明らかとなった. | 510-525 | |||||||||||||||||
69 | English | Vol. 33, No.7 | December 20, 2020 | Invited paper (B) | OHKAWA Komei | A Stylistic Typology of Kamakura Period Literature: From the Perspective of Predicates | opposition of wa versus kan, wabun, kanbun kundoku-style, genre-related style, correspondence analysis, cluster analysis | In this study, I conducted a stylistic typology of literary works from the Kamakura period, including wabun ‘native-style literature’ and gunki mono ‘war chronicles, which are considered to be a type of wakan konkōbun ‘Japanese-Chinese hybrid style literature’, based on the properties of sentence predicates and a comparison with the results of Okawa (2020), using correspondence analysis and cluster analysis. As a result, I found that Kamakura period wabun could be divided into two types: 1. standard kikōbun ‘travelogues’ and wakashū ‘waka anthologies’ and 2. wabun and kikōbun and wakashū with strong stylistic features. Gunki mono were grouped together with kanbun kundoku ‘vernacular reading of Literary Sinitic’-inspired literature and diaries, revealing that such chronicles have stylistic characteristics similar to works such as "Konjaku Monogatari-shu" in terms of opposition of wa versus kan, and in terms of genre-related style. | 510-525 | |||||||||||||||||
70 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・論文B | 李文平,劉海濤,呉長紅 | 芥川龍之介の児童文学の文体に関する計量的分析 | 芥川龍之介,児童文学,統語複雑度,統語依存関係,依存距離,文構造特性値,平均文長,語彙の豊富さ,語彙の難易度 | 本研究では芥川龍之介の児童文学の文体的特徴を分析するために,芥川の児童文学8作品を対象に語彙の難易度,語彙の豊富さ,統語複雑度,平均文長を計量的に分析した.その結果,次の3点が明らかになった.第一に,芥川の成人文学に使われている語彙に比べて,芥川の児童文学に使われている語彙はより簡単であり,語彙の種類もより少ないことが明らかになった.第二に,彼の児童文学において統語複雑度は成人文学より低く,平均文長も短いことがわかった.第三に,芥川の児童文学の文体的特徴は一般の児童文学の文体的特徴をある程度反映していることが明らかになった.このことから,芥川の成人文学に比べて児童文学は読みやすいことが示唆された.これは彼が自らの子ども,親せきの子ども,主治医の子どもを直接の読者に想定して児童文学を創作したことによるものであると考えられる. | 526-540 | |||||||||||||||||
71 | English | Vol. 33, No.7 | December 20, 2020 | Paper (B) | LI Wenping, LIU Haitao, WU Changhong | Quantitative Analyses of Ryūnosuke Akutagawa's Children's Literature | Ryūnosuke Akutagawa, children's literature, syntactic complexity, dependency relation, dependency distance, characteristic value of sentence structure, average sentence length, lexical richness, lexical difficulty | In order to analyze the stylistic characteristics of Ryūnosuke Akutagawa's children's literature, this study employs eight children's literature of Akutagawa as the research object. This research makes a quantitative analysis of lexical richness, lexical difficulty, sentence length, and syntactic complexity. Three research findings reveal that: Firstly, in terms of lexicon, the use of the words is simple in Akutagawa's children's literature, and the vocabulary richness is relatively low. Secondly, in terms of sentences, the syntactic complexity and average sentence length of Akutagawa's children's literature are lower than those of adult literature. Thirdly, it is clear that the stylistic characteristics of Akutagawa's children's literature reflect some extent the stylistic characteristics of children's literature in general. Therefore, the reading difficulty of Akutagawa's children's literature is lower than that of adult literature. This may be due to the fact that the author assumed his own children, his relatives' children, and the doctor's child as their direct readers. | 526-540 | |||||||||||||||||
72 | 日本語 | 33巻7号 | 2022年12月20日 | 特集・招待論文・文献紹介 | 丸山直子 | Jポップの歌詞研究―伊藤雅光氏の研究手法を用いた卒業論文の紹介― | 541-545 | |||||||||||||||||||
73 | English | Vol. 33, No.7 | December 20, 2020 | Invited Paper (Resource) | MARUYAMA Naoko | Research on J-pop lyrics: Introduction of Graduation Theses Using Masamitsu Ito's Research Method | 541-545 | |||||||||||||||||||
74 | 日本語 | 33巻7号 | 2022年12月20日 | 解説 | 堀恵子 | 言語統計学入門(7)クロス集計表の分析方法(その1) | クロス集計表,調整頻度,周辺度数,期待値, カイ二乗検定,2項分布,フィッシャーの正確確率検定 | 質的データを分析する際に,クロス集計表の形で示すことは,どのような手順で分析を行ったかを明確に示すために重要である.本稿ではクロス集計表に関わる用語を紹介した上で,条件とカテゴリー数の異なるクロス集計表について,検定法を示した.クロス集計表の種類は,2条件(対応がある場合,対応がない場合),対応のないi×j表を取り上げた. また,カイ二乗検定を適用することが不適切となる場合の対応法として,⑴各セルのデータ数を一定数以上とするためにデータ数を増やすこと,⑵フィッシャーの正確確率検定を利用すること,を取り上げ,カテゴリーの合併の弊害についても述べた | 546-556 | |||||||||||||||||
75 | English | Vol. 33, No.7 | December 20, 2020 | Tutorial | HORI Keiko | An Introduction to Statistics in Linguistics (7): How to Analyze Crosstabulation Tables (Part 1) | Crosstabulation tables, adjusted frequencies, marginal frequencies, expected values, chi-square test, binomial distribution, Fisher's exact probability test | When analyzing qualitative data, it is important to present them in the form of crosstabulation tables so that the procedures used are evident. This paper introduces the terminology involved in crosstabulation tables and then presents the methods for testing crosstabulation tables with different conditions and several categories. Crosstabulation tables of two conditions (with and without correspondence) and i × j tables (without correspondence) are used. Additionally, the adverse effects of category mergers are discussed, including (1) increasing the quantity of data so that the number of data in each cell exceeds a certain number and (2) employing Fisher’s exact probability test as a method for dealing with cases, in which it is inappropriate to apply the chi-square test. | 546-556 | |||||||||||||||||
76 | 日本語 | 33巻8号 | March 20, 2023 | 特集・論文B | 尾木竜司,池田大輔 | 書き手の内面の変化に伴う文体の個人内恒常性の崩壊の検証―出産経験のある女性のSNS投稿を用いた調査― | 文体的特徴,計量的分析,縦断的調査,経年変化,SKLD,ソーシャルネットワーク,ブログ,ライフイベント,出産 | 文章には書き手の個性が表れ,その個性は大きく変化しないこと(個人内恒常性)が知られている.逆に,メンタルヘルスの異常など書き手の内面の大きな変化が恒常性の崩壊につながることを示せれば,文体的特徴の変化から内面の変化を検出できるようになる可能性がある.特定の個人に対し,内面の大きな変化によって文体的特徴が変化することが示されているが,内面に同じ変化を持つ集団を集めるのは困難であり,統計的には示されていない.本研究では,出産は内面に大きな変化を与えると考え,出産経験のある女性らのブログの文体的特徴を調べた.単語の使用率など文章の内容に依存する特徴を用いると,書き手の内面の変化ではなく生活環境の変化を検出してしまう.そこで,非内容語の使用率や品詞のbigramの出現率などの,文章の内容に依存しない特徴を用いた.検証した全ての特徴において,出産を経ることで通常の変動よりも変化することがわかった. | 571-585 | |||||||||||||||||
77 | English | Vol. 33, No.8 | March 20, 2023 | Paper (B) for the 2022 Special Section | OGI Ryuji, IKEDA Daisuke | Disruption of Consistency in Writing Styles from Writer’s Internal Change: Analyses of Prenatal and Postnatal SNS Posts of Women | writing style, quantitative analysis, longitudinal study,secular change, SKLD, social network, blog, life event, childbirth | It is known that writing style depends on individuals and maintains consistency in each individual. If we can prove that some changes in writing style are caused by a significant transition in writer's state of mind including mental illness, psychological change can be detected from a change of writing style. Previous studies showed that, for a specific novelist, a transition in the writer's mind leads to changes in its writing style. However, little research has been conducted on population studies, because it is difficult to sample many people who have the same type of mind transition. To solve this problem, assuming that women make internal transitions when they become mothers, we constructed a large corpus of their blog entries before and after their delivery. If we select features that depend on the contents of the text such as frequency of words, we will find the changes of writing style based on shifts of their lifestyles rather than their internal transitions. Therefore, we used characteristics that do not depend on the topics of the text such as frequency of non-content words and bigram of parts-of-speech. This study shows that their internal transitions associated with childbirth causes their writing style change. | 571-585 | |||||||||||||||||
78 | 日本語 | 33巻8号 | March 20, 2023 | 論文B | 陳暁静 | カタカナ語「ソフト」の形容動詞化と類義語の意味変化―類義語「やわらかな」「柔軟な」との比較から― | カタカナ語 類義語 ソフト 柔軟な やわらかな | 『朝日新聞』のデータベース(ビジュアル聞蔵Ⅱ)を用いた調査によれば,カタカナ語「ソフト」は「ソフトハット」が山高帽に対し柔らかな「中折帽」を表す名称として導入され,その「ソフト」が次第に形容する対象と意味範囲を広げ,やがてナ形容詞「ソフトな」を生んだ.この成立以後,外来語とそれを修飾する新しい表現型を獲得した.また,類義分野では「やわらかな」の領域を浸食したが,「柔軟な」の領域とは関係しなかった. | 586-601 | |||||||||||||||||
79 | English | Vol. 33, No.8 | March 20, 2023 | Paper B | CHEN Xiaojing | On a Change of the Loanword sofuto from a Noun to an Adjective Verb: Comparing with Synonyms yawarakana and junan’na | katakana synonyms sofuto junan’na yawarakana | Through the investigation of Asahi Shimbun, Katakana sofuto was introduced as a soft hat which expresses a soft “trilby hat” against a “mountain cap” in the study. Gradually, sofuto began to appear in Japanese as a modifier and its meaning expanded. Soon, the adjective verb sofutona appeared. Since then, loanwords and their new modification methods have been absorbed by Japanese and occupied part of the meaning of yawarakana, but they have little influence on junan’na. | 586-601 | |||||||||||||||||
80 | 日本語 | 33巻8号 | March 20, 2023 | 研究ノート | 横山詔一,前田忠彦,高田智和,相澤正夫,野山広,福永由佳,朝日祥之,久野雅樹 | 日本人の読み書き能力1948年調査における非識字率と生年の関係 | 読み書き能力,非識字率,生年,言語変化のS字カーブ説,キャズム理論,ロジスティック回帰分析,小学校就学率 | 1948年に実施された日本人の読み書き能力調査のデータを用いて非識字率と生年との関係を分析した.言語変化のS字カーブ説と見かけ上の時間の考え方を援用して,非識字率を目的変数,生年と居住地(市部/郡部)を説明変数とするロジスティック回帰分析をおこなった.その結果,非識字率と生年には逆S字カーブの関係が認められ,生年が遅くなる(年齢が若い,下限は15歳)ほど非識字率が低下することが明らかになった.その主要な原因として,義務教育無償化による学習機会向上の効果が時間経過とともに顕在化したことが考えられる.また,郡部の非識字率の逆S字カーブをグラフ横軸(生年)に沿って左方向に6年間分平行移動させると,市部の逆S字カーブに重なることも示した. | 602-611 | |||||||||||||||||
81 | English | Vol. 33, No.8 | March 20, 2023 | Note | YOKOYAMA Shoichi, MAEDA Tadahiko, TAKADA Tomokazu, AIZAWA Masao, NOYAMA Hiroshi, FUKUNAGA Yuka, ASAHI Yoshiyuki, HISANO Masaki | The Relationship between Illiteracy Rate and Year of Birth as Seen in Data from the Survey of the Reading and Writing Ability of the Japanese in 1948 | reading and writing ability, illiteracy rate, year of birth, S-curve theory of language change, chasm theory, logistic regression analysis, elementary school enrollment | Using data on illiteracy rate obtained from the survey of the reading and writing ability of the Japanese in 1948, we analyzed the relationship between illiteracy rate and year of birth. Referring to the S-curve theory of language change and the concept of diachronic change analysis using apparent time, logistic regression analysis was conducted with illiteracy rate as the objective variable and year of birth and place of residence (urban or rural) as explanatory variables. The analysis revealed an inverse S-curve relationship between illiteracy rate and year of birth, with the illiteracy rate decreasing with later year of birth (younger age at the time of the survey, with a lower limit of 15 years). The main reason for this is thought to be the increase in the rate of elementary school enrollment over time, which was linked to the introduction of free compulsory education. The analysis also showed that the inverse S-shaped curve of the illiteracy rate in the rural area overlaps with the inverse S-shaped curve in the urban area when the time of six years is shifted parallel to the left along the horizontal axis of the graph (year of birth). | 602-611 | |||||||||||||||||
82 | 日本語 | 33巻8号 | March 20, 2023 | 文献紹介 | 上阪彩香 | Stefan Th. Gries (2022) Toward more careful corpus statistics: uncertainty estimates for frequencies, dispersions, association measures, and more. Research Methods in Applied Linguistics, Volume 1, Issue 1 | 612-614 | |||||||||||||||||||
83 | 日本語 | 33巻8号 | March 20, 2023 | 書評 | 李広微 | Pawłowski, Adam, Ján Mačutek, Sheila Embleton, George Mikros, eds. (2021) Language and Text. Data, models, information and applications. Amsterdam: John Benjamins Publishing. | 615-618 | |||||||||||||||||||
84 | 日本語 | 33巻8号 | March 20, 2023 | 解説 | 荻野綱男 | 言語統計学入門(8)クロス集計表の分析方法(その2) | クロス集計表,拡張クロス表,交互平均法 | 本稿では以下の4点を述べる.第1に,クロス集計表(クロス表)がどういうものであるかを述べる.本来のクロス表の例を示すとともに,それからやや外れた表も示し,クロス表の性質について考察する.第2に,同じ選択肢群による複数の質問群の単純集計を並べた拡張クロス表というものを提示する.拡張クロス表は従来のクロス表と同様に扱えるが,それとともにデータ分析に有利な点がいくつかあるので,それを解説する.第3に,拡張クロス表を扱うのに適した交互平均法の計算法を説明する.具体的なクロス表に基づいて,電卓でも計算できるように計算手順を示す.第4に,交互平均法の特徴を述べ,どのようなデータに適用するといいかを解説する. このようにして,本稿全体として,クロス表の形で示されるデータを分析する際の交互平均法のメリットを述べることにする. | 619-631 | |||||||||||||||||
85 | English | Vol. 33, No.8 | March 20, 2023 | Tutorial | OGINO Tsunao | An Introduction to Statistics in Linguistics (8): How to Analyze Crosstabulation Tables (Part 2) | cross-tabulation table, extended cross-tab, reciprocal averaging | The following four points are discussed in this paper. First, the concept of cross-tabulation table (or cross-tab) is described; a conventional cross-tab example, along with its slightly modified version is presented, to examine the essence of cross-tab analysis. Second, an extended cross-tab, which is a table listing simple tabulation of multiple questions of the same choice group, is presented. The extended cross-tab can be handled in the same manner as the conventional cross-tab. In addition, it has several advantages for data analysis, which will also be explained. Third, the calculation process of reciprocal averaging suitable for using extended cross-tab is explained; this is done by presenting a step-by-step calculation process using a specific cross-tab example, so that the process can be performed using an electronic calculator. Fourth, the characteristics of reciprocal averaging are presented, and the types of its applicable data is explained. Thus, the present paper, as a whole, describes the advantages of reciprocal averaging in the analysis of data given in cross-tab format. | 619-631 | |||||||||||||||||
86 | ||||||||||||||||||||||||||
87 | ||||||||||||||||||||||||||
88 | ||||||||||||||||||||||||||
89 | ||||||||||||||||||||||||||
90 | ||||||||||||||||||||||||||
91 | ||||||||||||||||||||||||||
92 | ||||||||||||||||||||||||||
93 | ||||||||||||||||||||||||||
94 | ||||||||||||||||||||||||||
95 | ||||||||||||||||||||||||||
96 | ||||||||||||||||||||||||||
97 | ||||||||||||||||||||||||||
98 | ||||||||||||||||||||||||||
99 | ||||||||||||||||||||||||||
100 |