FINAL REPORT
Quality assessment of choir singers
using Formant Analysis
โดย
นายวิศวชิต หนุมาศ
58070501067
อาจารย์ที่ปรึกษา
อาจารย์ประจำรายวิชา
Seminar 2/2560
Department of Computer Engineering
ABSTRACT
แรงจูงใจในการทำวิจัยเกี่ยวกับคุณภาพเสียงร้องของกลุ่มนักร้องประสานเสียงในครั้งนี้มาจากการที่ได้เป็นหนึ่งในสมาชิกวงประสานเสียงแห่งมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี หรือKMUTT Chorus ได้มีประสบการณ์ในการร้องเพลงและทำงานมาอย่างมากมาย ได้แข่งขันการขับร้องเพลงประสานเสียงในระดับนานาชาติ รวมถึงได้รับมอบหมายให้เป็นรองประธานวง วิธีการที่จะนำเสนอในรายงานเล่มนี้จะเปรียบเทียบคุณภาพเสียงร้องของนักร้องประสานเสียงโดยใช้พารามิเตอร์ที่ชื่อว่า “Formant Frequency” โดยจะทำการแบ่งกลุ่มนักร้องประสานเสียงออกเป็น4พาร์ทเสียง คือ Soprano, Alto, TenorและBass แต่ละกลุ่มจะแบ่งย่อยไปอีก3กลุ่มความเชี่ยวชาญ คือกลุ่ม Poor, Average และ Good นักร้องประสานเสียงแต่ละคนจะถูดทดสอบผ่านแบบฝึกหัดร้องเพลงที่เหมือนกัน แล้วนำค่าFormant Frequency ที่ได้มาเปรียบเทียบกัน ผลปรากฏว่าFormant Frequencyที่ได้จากนักร้องกลุ่มย่อยซึ่งแบ่งตามทักษะและความสามารถในแต่ละพาร์ทเสียงนั้นสามารถแยกความแตกต่างกันได้อย่างชัดเจน จึงสามารถสันนิษฐานได้ว่าFormant Frequencyนั้นเป็นพารามิเตอร์ที่สามารถประเมินคุณภาพเสียงร้องได้ และเป็นเครื่องมือที่ทำให้นักร้องในกลุ่ม PoorและAverageสามารถพัฒนาทักษะการร้องเพลงให้เก่งยิ่งขึ้นได้
INTRODUCTION
เสียงร้องที่ถูกเปล่งออกมาประกอบไปด้วยการทำงานของ3องค์ประกอบ คือ ระบบทางเดินหายใจ(The respiratory apparatus), การสั่นของเส้นเสียง(Vocal folds oscillating)และช่องเสียง(Vocal tract) โดยช่องเสียงจะเกี่ยวข้องโดยตรงกับปรากฏการณ์ที่เรียกว่าResonance ซึ่งเป็นปัจจัยสำคัญในด้านความแข็งแรงและคุณภาพของเสียงร้อง และส่งผลกับFormants ของช่องเสียงด้วย(โดยเฉพาะF1และF2) นั่นหมายความว่าบางHarmonicsของเสียงได้จะถูกขยาย สำหรับเสียงพูดที่มีความถี่ต่ำนั้น ช่องว่างระหว่างHarmonicsกับFormantsจะไม่ห่างกัน ในทางกลับกัน การร้องเพลงที่มีระดับเสียง(Pitch)สูงหรือความถี่สูงจะมีความแตกต่างระหว่างFormantsและ Harmonics ที่มากอย่างเห็นได้ชัด
รายงานเล่มนี้นำเสนอเพียงแค่ด้านหนึ่งของการประเมินคุณภาพเสียงร้องเท่านั้น คุณภาพของเสียงร้องยังสามารถประเมินได้ผ่านพารามิเตอร์อื่นๆได้อีกเช่น การออกเสียงสูงต่ำ(Intonation), ลักษณะของเสียง(Timbre), ลูกคอ(Vibrato)หรืออื่นๆ วิธีที่ได้ถูกพัฒนาขึ้นนี้ใช้วิธีของการวิเคราะห์สัญญาณเพื่อให้ได้ข้อมูลที่สามารถเปรียบเทียบตัวนักร้อง และเป็นแนวทางที่สามารถใช้พัฒนาต่อยอดต่อไปได้
LITERATURE REVIEW
Formant ถูกนำมาใช้ในการศึกษาต่างๆที่มีจุดประสงค์หลายอย่างเช่นการร้องเพลงและการประเมินคุณภาพเสียงหรือการจำแนกนักร้อง Formant ถูกนิยามไว้ใน2ทาง คำนิยามแรกโดย Gunnar Fant อธิบายว่าเป็นสัญญาณที่มีเสียงของมนุษย์[2] ในเชิงสัทวิทยาและบทความทางวิทยาศาสตร์ formantยังถูกอธิบายว่าเป็นการสั่นพ้อง(Resonance)จากช่องเสียงของมนุษย์ Resonance ในด้านของการผลิตเสียงโดยทั่วไปจะถูกอธิบายอยู่ในเทอมของFormant Frequency ที่4หรือ5เท่านั้น ค่าของFormant Frequencyจะขึ้นอยู่กับองค์ประกอบภายในช่องเสียงซึ่งเป็นที่รู้กันดีว่าFormant Frequencyจะมีค่าได้หลากหลายในแต่ละประเภทของเสียง (เช่นนักร้องพาร์ทเสียงBassและTenor)[3]
เป็นที่เชื่อถือกันว่าFormantที่1(F1) และFormantที่2(F2) นั้นสัมพันธ์กับคุณภาพของเสียง เป็นค่าที่สามารถควบคุมและปรับเปลี่ยนได้ในการร้องเพลงหรือเรียกกันว่า “Formant tuning” ซึ่งเป็นเทอมที่ใช้กันโดยทั่วไปเมื่อหนึ่งในFormant มีความถี่ที่ใกล้เคียงระดับเสียง(Pitch)[4] หลักการนี้มุ่งใช้เพื่อบ่งบอกหรือปรับเปลี่ยนธรรมชาติในการร้องเพลงและการคงมาตรฐานการร้องเพลของนักร้อง ข้อสันนิษฐานคือนักร้องที่ผ่านการฝนฝนและมีประสบการณ์การร้องเพลงมาแล้วสามารถปรับเปลี่ยนความถี่Formantให้อยู่ในระดับที่ต้องการหรือเพื่อให้มีลักษณะของเสียงที่ไม่ผิดแปลกไปได้ ยกตัวอย่างเช่น ทำอย่างไรให้ร้องคำสระในโน้ตที่สูงมากขึ้น โดยให้F1เป็นปกติคงที่ แทนที่จะเพิ่มขึ้นหรือลดลง(จากการปรับเปลี่ยนบางอย่างในช่องเสียงหรือVocal tract) และนี่คือความท้าทายอย่างหนึ่งในการฝึกฝนขั้นพื้นฐานในการร้องโอเปรา แต่ในขณะเดียวกันก็มีผู้ที่โต้แย้งในกรณีนี้อยู่ด้วย
Formantที่3(F3), Formantที่4(F4) และFormantที่5(F5) มีบทบาทสำคัญในการสร้าง “singer’s formant” หรือเรียกว่า “2.8kHz” ถูกอธิบายโดยนายSundbergว่า คือองค์ประกอบของลักษณะเสียงในนักร้องอาชีพผู้ชายหรือนักร้องในพาร์ทเสียงAlto[5] งานศึกษามากมายได้อธิบายและวิเคราะห์ “singer’s formant” ว่าคือสิ่งสำคัญที่จะทำให้เสียงร้องนั้นเด่นออกมาจากเสียงเครื่องดนตรีทั้งหลายที่เล่นด้วยกันอยู่ในขณะนั้น[4] [6]จากที่นายSundbergกล่าวไว้ กลุ่มของ Formantเหล่านี้จะปรากฏเมื่อ Formantที่3,4และ5 นั้นมีความถี่เข้าใกล้กันที่บริเวณ3kHz นายFant[7]พบว่า F3และF4 จะเข้าใกล้กันมากกว่าในกรณีของการร้องเพลงมากกว่าการพูด มากไปกว่านั้นมันดูเหมือนว่ามันจะใกล้กันมากขึ้นในเสียงของนักร้องที่ได้รับการฝึกฝนมากกว่านักร้องมือใหม่ การประเมินการร้องเพลงผ่านวิธีการSpectral Analysisพบว่าในกลุ่มนักร้องอาชีพที่ได้รับการฝึกฝนและมีประสบการณ์ ค่าF3,F4และF5จะมีค่าสูงอยู่ในช่วง 2600-3200Hz [6] ในขณะที่นักร้องมือใหม่จะสามารถสร้างความถี่ในช่วงที่เพียงพอสำหรับการระบุสระเท่านั้น
งานวิจัยที่อ้างอิงมานี้ยังให้ข้อมูลเกี่ยวกับความเหมือนและความแตกต่างกันของFormant ในการพูดและร้องเพลงของนักร้องเพลงที่ฝึกฝนการร้องคลาสสิค[8] ยกตัวอย่างเช่น ในกลุ่มนักร้องเพลงcountry(เพลงลูกทุ่งในต่างประเทศ)นั้น Formantของสระ/i/, /a/, and /o/ จะคล้ายคลึงกันในทั้งการพูดและร้องเพลง[9] อย่างไรก็ตามคุณลักษณะนี้อาจจะผิดเพี้ยนไปด้วยนิสัย สไตล์และความชอบส่วนตัวของการพูดและร้อง การเปรียบเทียบเหล่านี้ทำให้พบว่านักร้องมีFormantเดียวกันหรือสูงกว่าตอนที่พวกเข้าพูดเล็กน้อยเมื่อพวกเขาร้องเพลง ซึ่งเป็นลักษณะที่พบได้โดยทั่วไปในนักร้องคลาสสิก
ในการพิจารณาความแตกต่างระหว่างลักษณะเนื้อเสียงของนักร้องละครเวทีและนักร้องโอเปร่า[11]โดยใช้Formant Frequency งานวิจัยแสดงให้เห็นว่านักร้องละครเวทีแสดงค่า Formantที่สูงกว่า อีกทั้งยังไม่มีการจัดกลุ่มกันที่ชัดเจนของ F3,F4และF5ในกลุ่มนักร้องโอเปร่า
RESEARCH MATERIAL
การศึกษาในครั้งนี้ใช้งานวิจัยที่ใช้อ้างอิงมาจากฐานข้อมูลของ West Pomeranian University of Technology ชื่อว่า “Computerized methods of supporting the process of training choir voices” ซึ่งงานศึกษาของข้าพเจ้าเล่มนี้ได้เอาข้อมูลในส่วนของแบบฝึกหัดการร้องมาใช้ทั้งหมด4แบบฝึกหัด ซึ่งมีวัตถุประสงค์เฉพาะเจาะจงในแต่ละแบบฝึกหัด ยกตัวอย่างเช่น การเปลี่ยนPitchอย่างฉับพลัน หรือเปลี่ยนสระ(Vowel)อย่างฉับพลันในรอบของการร้องหนึ่งๆ และใช้กลุ่มทดลองเป็นนักร้องประสานเสียงจากKMUTT Chorusทั้งหมด11คน
ฐานข้อมูลประกอบไปด้วย แบบฝึกหัดการออกเสียงสระซึ่งแสดงในรูปภาพที่1 ซึ่งเลือกออกมาจากกลุ่มแบบฝึกหัดที่มักจะถูกใช้ระหว่างการฝึกร้องเพลง คุณสมบัติที่สำคัญที่สุดของแต่ละแบบฝึกหัดคือ โครงสร้างของแบบฝึกหัดจะอ้างอิงถึงคีย์C-major และตรงตามค่าโน้ตในแบบฝึกหัดด้วยจังหวะความเร็ว60BPM แบบฝึกหัดแรกเป็นแบบฝึกหัดที่ยอดเยี่ยมสำหรับการเปรียบเทียบนักร้องแต่ละคนโดยใช้Formant เพราะแบบฝึกหัดที่1 จะประกอบไปด้วยการร้องสระที่แตกต่างกัน5สระในPitchเดียวกัน ซึ่งจะให้ผลลัพธ์ของFormantที่เห็นความแตกต่างกันได้ดีในช่วงเวลาที่ใกล้เคียงกัน กลุ่มตัวอย่างทุกคนมีประสบการณ์การขับร้องประสานเสียงอยู่ในช่วง1-12ปี และช่วงอายุอยู่ระหว่าง18-30ปี ซึ่งถูกเลือกจาก4พาร์ทเสียงคือ คือ Soprano, Alto, TenorและBass แต่ละกลุ่มจะแบ่งย่อยไปอีก3กลุ่มความเชี่ยวชาญ คือกลุ่มผู้เริ่มต้น(Poor)จำนวน4คนรหัสประจำตัวP01s, P02a, P03tและP04b, กลุ่มมีประสบการณ์ปานกลาง (Average)จำนวน4คนรหัสประจำตัวA01s, A02a, A03tและA04b และกลุ่มสุดท้ายคือกลุ่มระดับสูงสุดในการทดลองคือกลุ่มผู้เชี่ยวชาญหรือประสบการณ์สูง(Good)จำนวน3คนรหัสประจำตัวG01a, G02t และG03b รายการข้อมูลของนักร้องทุกคนที่ถูกนำมาทดลองถูกแสดงไว้ในตารางที่1
รูปที่1แบบฝึกหัดการร้องจากฐานข้อมูลงานวิจัยที่อ้างอิง
Singer | Part | Advancement Level | Age | Singing experience(years) | Note |
P01s | Soprano | Poor | 20 | 2 | - |
P02a | Alto | Poor | 18 | 1 | - |
P03t | Tenor | Poor | 19 | 1 | - |
P04b | Bass | Poor | 20 | 2 | - |
A01s | Soprano | Average | 21 | 3 | Soprano Voice Leader KMUTT Chorus |
A02a | Alto | Average | 20 | 2 | Alto Voice Leader KMUTT Chorus |
A03t | Tenor | Average | 20 | 2 | Tenor Voice Leader KMUTT Chorus |
A04b | Bass | Average | 22 | 3 | Bass Voice Leader KMUTT Chorus |
G01a | Alto | Good | 22 | 4 | Suanplu Chorus member |
G02t | Tenor | Good | 22 | 4 | Suanplu Chorus member |
G03b | Bass | Good | 30 | 12 | Bangkok Voices member, Conductor KMUTT Chorus |
ตารางที่1 รายการข้อมูลนักร้องที่นำมาทดลอง
PERFORMED EXPERIMENT
แนวคิดการทดลองจะนำFormantที่1(F1) และFormantที่2(F2) มาเปรียบเทียบกันในแต่ละกลุ่มความเชี่ยวชาญ โดยที่จะแยกเปรียบเทียบกันในเฉพาะกลุ่มพาร์ทเสียงเดียวกันเท่านั้น นักร้องทุกคนจะถูกอัดเสียงร้องตามแบบฝึกหัดข้างต้นผ่านเข้าซอฟต์แวร์Praat ที่Sampling Frequencyเท่ากับ48kHz เพื่อหาค่าF1และF2ในแต่ละช่วงความสนใจหรือวัตถุประสงค์ของแบบฝึกหัดนั้นๆ
เป้าหมายของการทดลองคือการเปรียบเทียบค่าFormantจากนักร้องแต่ละคนกับค่าFormantของกลุ่มนักร้องความเชี่ยมชาญอื่นๆ แล้วนำค่าที่ได้มาเขียนบนกราฟ โดยที่ค่าFormantของนักร้องคนที่ถูกทดสอบจะอยู่ในแนวแกนX และFormantของกลุ่มความเชี่ยวชาญอื่นที่นำมาเปรียบเทียบจะถูกแสดงในแนวแกนY ยกตัวอย่างเช่น นักร้องในกลุ่มความเชี่ยวชาญPoor พาร์ทเสียงBassร้องโน้ตC3 ค่าF1ที่ได้คือ507Hz ส่วนนักร้องในกลุ่มความเชี่ยวชาญGood พาร์ทเสียงBass เช่นเดียวกันร้องโน้ตC3ได้ค่าF1คือ580Hz ก็จะได้พิกัด (507,580) บนกราฟเป็นต้น
EXPERIMENTAL RESULTS
ในการทดลองแรก ได้นำนักร้องในกลุ่มความเชี่ยวชาญPoorในแต่ละพาร์ทเสียงมาเปรียบเทียบกับนักร้องในระดับความเชี่ยวชาญAverageที่เป็นพาร์ทเเสียงเดียวกัน ผลลัพธ์แสดงดังกราฟที่1-กราฟที่4 แต่ละกราฟได้ถูกคำนวณค่าFormantของนักร้องแต่ละคนในกลุ่มความเชี่ยวชาญPoor(แนวแกนX) เปรียบเทียบกับค่าFormant ของนักร้องในกลุ่มระดับความเชี่ยวชาญAverage(แนวแกนY)ที่เป็นพาร์ทเเสียงเดียวกัน ข้อมูลที่อยู่ในกราฟแต่ละอันคือเปอร์เซนต์ของจำนวนจุดพิกัดที่อยู่เหนือและอยู่ใต้ เส้น X=Y จากผลการทดลองระบุได้ว่า นักร้องในระดับความเชี่ยวชาญPoorในพาร์ทเสียงSopranoและTenorแต่ละคนมักจะมีความถี่Formantต่ำกว่า กับความถี่Formantของนักร้องในกลุ่มระดับความเชี่ยวชาญAverageที่เป็นพาร์ทเสียงเดียวกัน ส่วนนักร้องในระดับความเชี่ยวชาญPoorในพาร์ทเสียงAltoและBassแต่ละคนมักจะมีความถี่Formantสูงกว่า กับความถี่Formantของนักร้องในกลุ่มระดับความเชี่ยวชาญAverageที่เป็นพาร์ทเสียงเดียวกัน
กราฟที่1 Poor vs Average (Soprano)
กราฟที่2 Poor vs Average (Alto)
กราฟที่3 Poor vs Average (Tenor)
กราฟที่4 Poor vs Average (Bass)
อีกการทดลองคือนำนักร้องในกลุ่มความเชี่ยวชาญPoorในแต่ละพาร์ทเสียงมาเปรียบเทียบกับนักร้องในระดับความเชี่ยวชาญGoodที่เป็นพาร์ทเเสียงเดียวกัน ผลลัพธ์แสดงดังกราฟที่5-กราฟที่7 ในรูปแบบการทดลองเดียวกัน ผลการทดลองระบุได้ว่า นักร้องในระดับความเชี่ยวชาญPoorแต่ละคนมักจะมีความถี่Formantสูงกว่าความถี่Formantของนักร้องในกลุ่มระดับความเชี่ยวชาญGoodที่เป็นพาร์ทเเสียงเดียวกัน
*หมายเหตุ ไม่สามารถหานักร้องพาร์ทเสียงSopranoและระดับความเชี่ยวชาญGoodที่เหมาะสมได้ จึงไม่มีข้อมูลเปรียบเทียบ
กราฟที่5 Poor vs Good (Alto)
กราฟที่6 Poor vs Good (Tenor)
กราฟที่7 Poor vs Good (Bass)
CONCLUSION
งานศึกษานี้นำเสนอวิธีการหนึ่งเพื่อใช้ในการเปรียบเทียบและประเมินคุณภาพของนักร้องประสานเสียงในบริบทของการใช้Formant Frequency และนั่นก็สามารถทำให้เห็นว่าสมาชิกแต่ละคนของKMUTT Chorusซึ่งมีทักษะและประสบการณ์ต่างกัน นั้นไม่ได้มีคุณภาพของการร้องเพลงที่สอดคล้องกันในแต่ละบุคคลและพาร์ทเสียงในเทอมของFormant Frequency อย่างไรก็ตามการทดลองนี้ก็ยังเกิดข้อสังเกตบางอย่างที่น่าสนใจ
ผลสรุปการทดลองที่อยู่ในตารางที่2 ข้างล่างนี้ แสดงถึงเปอร์เซ็นต์ของFormant Frequencyที่มากเกินไปของนักร้องในกลุ่มความเชี่ยวชาญPoor เปรียบเทียบกับนักร้องในกลุ่มความเชี่ยวชาญAverageและGood จะเห็นว่านักร้องในระดับความเชี่ยวชาญPoorกับAverage ผลการทดลองนั้นไม่ได้ไปในทิศทางเดียวกัน ไม่สามารถตีความสรุปผลได้แน่ชัด ทั้งนี้อาจเป็นเพราะองค์ความรู้ ทักษะและประสบการณ์ต่างๆด้านการร้องเพลงนั้นแตกต่างกันไม่มากนัก
ในทางกลับกันนักร้องในระดับความเชี่ยวชาญPoorกับGoodเมื่อเปรียบเทียบกันแล้วนั้น ผลการทดลองเป็นไปในทิศทางเดียวกันนั่นคือ นักร้องในระดับความเชี่ยวชาญPoorจะมีFormantสูง กว่ากลุ่มที่เป็นนักร้องในระดับความเชี่ยวชาญGood
Percent of higher Formant Frequencies than corresponding frequencies in the following | ||
Poor singer | Average | Good |
P01s | 32.3529 % | - |
P02a | 58.3333 % | 61.1111 % |
P03t | 38.2353 % | 55.8824 % |
P04b | 64.7059 % | 57.1429 % |
Mean | 48.40685 % | 58.0454 % |
ผลลัพธ์แสดงให้เห็นว่ามีความเป็นไปได้ที่จะสร้างระบบประเมินเสียงร้องได้โดยอัตโนมัติ โดยอ้างอิงพื้นฐานบนคุณสมบัติของFormant Frequency และยังแสดงให้เห็นว่าเราสามารถตัดสิน คุณภาพเสียงร้องโดยอ้างอิงจากผู้ที่เชี่ยวชาญด้านการร้องเพลงได้ การตัดสินที่กล่าวมานี้จะน่าเชื่อถือมากยิ่งขึ้นหากนำเกณฑ์ประเมินการร้องเพลงในด้านอื่นมาร่วมประเมินด้วยเช่น การออกเสียงสูงต่ำ(Intonation) หรือลูกคอ(Vibrato)เป็นต้น ในการดำเนินการครั้งถัดไป ข้าพเจ้าวางแผนที่จะต่อยอดองค์ความรู้ออกไปยังพารามิเตอร์อื่นๆที่สามารถประเมินเสียงร้องได้ สุดท้ายนี้ความแม่นยำของการทดลองและการประเมินผลในครั้งนี้ขึ้นอยู่กับหลายปัจจัย เช่นความรู้เชิงเทคนิค, การกำหนดตัวแปรในการทดลอง, อุปกรณ์ที่ใช้ในการทดลอง, เพศ, พาร์ทเสียง, โครงสร้างร่างกาย, ความผิดปกติต่างๆ, ทักษะและประสบการณ์ในการร้องเพลง ซึ่งข้าพเจ้าจะปรับปรุงให้ดีขึ้นในโอกาสถัดไป
REFERENCES
[1] Polrolniczak, E.; Kramarczyk, M.
“Formant analysis in assessment of the quality of choral singers”
pp.200 - 204, IEEE
[2] H. T. Tan and M. Dong
“Analyzing the relationship between formants and pitch for singing voice”
Asian Language Processing (IALP), 2011 International Conference, pp. 248-252, IEEE
[3] T. F. Cleveland
“Acoustic properties of voice timbre types and their influence on voice classification”
The Journal of the Acoustical Society of America, vol. 61, p. 1622, 1977
[4] L. Regnier and G. Peeters
“Singing voice detection in music tracks using direct voice vibrato detection”
pp. 1685-1688, IEEE
[5] J. Sundberg
“Articulatory interpretation of the “singing formant””
The Journal of the Acoustical Society of America, vol. 55, p. 838, 1974
[6] V. M. O. Barrichelo, R. J. Heuer, C. M. Dean and R. T. Sataloff
“Comparison of singer's formant, speaker's ring, and 1 ta spectrum among classical singers and untrained normal speakers”
Journal of voice, vol. 15, no. 3, pp. 344-350, 2001
[7] G. Fant
Acoustic theory of speech production
1970, Walter de Gruyter
[8] J. Sundberg
“Formant structure and articulation of spoken and sung vowels”
Folia Phoniatrica et Logopaedica, vol. 22, no. 1, pp. 28-48, 2009
[9] P. Burns
“Acoustical analysis of the underlying voice differences between two groups of professional singers: opera and country and western”
The Laryngoscope, vol. 96, no. 5, pp. 549-554, 1986
[10] Irene L..; Harris D..
“Harmonics Vs. Formants”
N/A, [online] Available:
https://www.voicescienceworks.org/harmonics-vs-formants.html
[11] E. Björkner
“Musical theater and opera singing-why so different? a study of subglottal pressure, voice source, and formant frequency characteristics”
Journal of Voice, vol. 22, no. 5, pp. 533-540, 2008
[12] N. Seo
Enee632 project4 part i: Pitch detection
2008, [online] Available:
http://note.sonots.com/?plugin=attach&refer=SciSoftware%2FPitch&openfile
=pitch.pdf
[13] นิรนาม.
“เสียงและรูปสระ”
N/A, [online] Available;
https://sites.google.com/site/siangphasathiy/seiyng-laea-rup-phyaychna
[14] อติวงศ สุชาโต.
“การอ่าน Spectrogram ของเสียงพูด”
2549, [online] Available:
https://www.cp.eng.chula.ac.th/~atiwong/2110432/docs/Spectrogram.pdf