หน่วยการเรียนรู้ที่ 4   ใบความรู้ที่  1

ชื่อ-นามสกุล.......................................................................แผนกวิชา.........................................เลขที่.............ระดับชั้นปี..............................ชื่อรายวิชา การใช้โปรแกรมสื่อประสม    อาจารย์ผู้สอน  นายสุภัตต์  วัตรสาร

เรื่อง ประเภทของเสียง รูปแบบของแฟ้มข้อมูลเสียง การจัดเก็บแฟ้มข้อมูลเสียง และซอฟต์แวร์สำหรับเทคโนโลยีเสียง

เรื่อง เสียง (Sound) หรือ ออดิโอ (Audio)        

เสียง (Sound)

        เสียงเป็นองค์ประกอบหนึ่งที่นิยมนำมาใช้งานด้านมัลติมีเดีย ซึ่งสามารถถ่ายทอดอารมณ์ไปยังผู้ชมได้ เช่น การใช้เสียงระทึกใจเพื่อทำให้เกิดความตื่นเต้น หรือเสียงนกร้องเพื่อสร้างบรรยากาศตามธรรมชาติ ดังนั้น การเลือกใช้เสียงกับมัลติมีเดียอย่างเหมาะสมย่อมสร้างความรู้สึกที่ดีและน่าประทับใจให้กับผู้ชมงานนำเสนอได้ โดยเนื้อหาบทนี้จะกล่าวถึงความรู้ทั่วไปเกี่ยวกับออดิโอ เช่น อุปกรณ์สำหรับออดิโอ รูปแบบไฟล์ออดิโอ และซอฟต์แวร์สำหรับออดิโอ เป็นต้น

ทำความรู้จักกับเสียง (Sound)

        เสียง (Sound) อยู่ในรูปแบบของพลังงาน (Energy) เหมือนกับพลังงานความร้อน (Heat) และพลังงานแสง (Light) ที่สามารถถ่ายทอดจากที่หนึ่งไปยังอีกที่หนึ่งผ่านตัวกลางที่เกิดจากการสั่น (Vibrating) ของวัตถุ และแปลงพลังงานที่อยู่ในรูปแบบคลื่นที่ประกอบด้วยแอมพลิจูด (Amplitude) และความถี่ (Frequency) ของคลื่นเสียง ตัวอย่างเช่น เมื่อสั่นกระดิ่งจะเกิดเป็นพลังงานเดินทางผ่านตัวกลางที่เป็นอากาศเพื่อถ่ายทอดพลังงานดังกล่าว และสะท้อนมายังหูของมนุษย์ เป็นต้น โดยปกติมนุษย์สามารถได้ยินเสียงที่มีความถี่อยู่ระหว่าง 20 ถึง 20,000 เฮิรซต์ ในปัจจุบันเทคโนโลยีการผลิตเสียงได้เข้ามีบทบาทในการใช้ชีวิตมนุษย์เป็นอย่างมาก ทำให้เกิดวิทยาศาสตร์แขนงหนึ่งที่เรียกว่า อะคูสติกเอ็นจิเนียร์ริ่ง (Acoustic Engineering)” ซึ่งศึกษาเกี่ยวกับโครงสร้าง (Generation) การถ่ายทอด (Transmission) และการรับ (Reception) คลื่นเสียง

        ในปี ค.ศ. 1957 Olson ได้นิยามธรรมชาติของคลื่นเสียงว่า “เสียงที่เกิดการเปลี่ยนแปลงด้านความกดอากาศ การที่คลื่นของอนุภาคหรือความเร็วของอนุภาคในการถ่ายทอดเสียงป่านวัตถุที่มีความยืดหยุ่น” การถ่ายทอดพลังงานเสียงผ่านตัวกลางเป็นการกำหนดรูปแบบของการบีบอัดอนุภาคเสียง และตัวกลางที่มีความหนาแน่นของโมโลกุลน้อยกว่าบริเวณใกล้เคียงทำให้อนุภาคสามารถเคลื่อนที่ผ่านตัวกลางนั้นๆได้

        ในทางอิเล็กทรอนิกส์การนำเสียงมาใช้งานจะต้องผ่านกระบวนการต่างๆ มากมาย โดยจะต้องเปลี่ยนแปลงคลื่นเสียงให้อยู่ในรูปแบบของสัญญาณอิเล็กทรอนิกส์ด้วยอุปกรณ์ต่างๆ เช่น ไมโครโฟน ซึ่งจะแปลงคลื่นเสียงให้กลายเป็นสัญญาณอิเล็กทรอนิกส์ จากนั้นแปลงสัญญาณอิเล็กทรอนิกส์กลับไปเป็นคลื่นเสียงตามเดิมและส่งคลื่นเสียงผ่านทางลำโพง

        การวัดระดับของคลื่นเสียงจะมีหน่วยวัดที่เข้ามาเกี่ยวข้องอยู่ 2 หน่วย คือ เดซิเบล (Decibel) ซึ่งเป็นหน่วยวัดความดังของเสียงและเฮิรตซ์ (Hertz: Hz) หรือจำนวนรอบของการแกว่งคลื่นเสียงในหนึ่งวินาที ซึ่งเป็นหน่วยวัดความถี่ของเสียง โดยสามารถแสดงระดับความดังและชนิดของเสียงได้ ดังนี้

ความดังของเสียง(เดซิเบล)

ชนิดของเสียง

0

เสียงที่แผ่วเบาที่สุดที่หูมนุษย์ได้ยิน

30

เสียงกระซิบ หรือเสียงในห้องสมุดที่เงียบสงัด

60

เสียงพูดคุยตามปกติ เสียงจักรเย็บผ้า หรือเสียงพิมพ์ดีด

85

เสียงตะโกนข้ามเขา หรือพื้นที่โล่งกว้าง เพื่อให้ได้ยินเสียงสะท้อนของตนเองกลับมา

90

เสียงเครื่องตัดหญ้า เสียงเครื่องจักรในโรงงาน หรือเสียงรถบรรทุก (ไม่ควรได้ยินเกินวันละ 8 ชม.)

100

เลื่อยไฟฟ้าหรือเครื่องเจาะที่ใช้ลม : Pneumatic Drill (ไม่ควรได้ยินเกินวันละ 2 ชม.)

115

เสียงระเบิดหิน เสียงในร็อคคอนเสิร์ต หรือเสียงแตรรถยนต์ (ไม่ควรได้ยินเกินวันละ 15 นาที)

140

เสียงยิงปืน เสียงเครื่องบินเจ็ต ซึ่งเป็นเสียงที่ทำให้ปวดหู และอาจทำให้หูเสื่อมได้ แม้ได้ยินเพียงครั้งเดียวก็ตาม ดังนั้นผู้ที่จำเป็นต้องอยู่กับเสียงในระดับนี้ จะต้องสวมอุปกรณ์ป้องกันหูเสมอ

        คลื่นเสียงที่มีระดับความดังมากๆ ที่ถือว่าเป็นอันตรายต่อกลไกการได้ยินนั้น คือ เสียงตั้งแต่ 85 เดซิเบลขึ้นไป ซึ่งความเสี่ยงของการสูญเสียการได้ยิน จะขึ้นอยู่กับความดังของเสียง และระยะเวลาของการได้ยิน ดังรายละเอียดในตารางส่วนวิธีการป้องกันที่ดีที่สุดคือ การหลีกเลี่ยงเสียงที่ดังจนเกินไป เช่น การหลีกเลี่ยงถนนที่มีการจราจรจอแจ การไปดูคอนเสิร์ตให้น้อยลง ไปเปิดเพลงจากซาวด์อะเบาต์ให้ดังมาก ไม่เปิดเสียงดังเกินไปในขณะที่ชมภาพยนตร์ หรือลดเสียงลำโพงให้เบาลงขณะเล่นเกมส์ เป็นต้น

องค์ประกอบของระบบเสียง

        การนำเสียงจากธรรมชาติมาใช้งานบนคอมพิวเตอร์ต้องผ่านกระบวนการบันทึก (Record) จัด (Manipulate) และเล่นเสียง (Playback) แต่ก่อนที่จะผ่านกระบวนการเหล่านี้จำเป็นต้องรับและแปลงเสียงให้อยู่ในรูปแบบที่เหมาะสม โดยใช้เครื่องมือสำหรับประมวลผลและแปลงเสียงต้นฉบับให้เป็นสัญญาณทางไฟฟ้า ได้แก่ ไมโครโฟน (Microphone) เครื่องขยายเสียง (Amplifier) ลำโพง (Speaker) และอุปกรณ์ปรับแต่งเสียง (Audio Mixer)

ไมโครโฟน (Microphone)

        ไมโครโฟน (Microphone) เป็นอุปกรณ์อิเล็กทรอนิกส์ ทำหน้าที่เปลี่ยนคลื่นเสียง (Sound wave) จากแหล่งกำเนิดเสียง เช่น เสียงพูด เสียงเพลง หรือเสียงดนตรี เป็นต้น ให้เป็นสัญญาณไฟฟ้า โดยความถี่เสียงจะเคลื่อนที่ไปตามสายไม่โครโฟนสู่เครื่องขยายเสียง และสามารถบันทึกเสียงได้ด้วยการแปลงพลังลังงานเสียงให้เป็นพลังงานไฟฟ้า

        สามารถแบ่งแบ่งชนิดของไมโครโฟนตามลักษณะโครงสร้างได้เป็น 2 ได้แก่ ไดนามิกไมโครโฟน (Dynamic Microphone) และคอนเดนเซอร์ไมโครโฟน (Condenser Microphone)

        ไดนามิกไมโครโฟน (Dynamic Microphone) หรือ มูฟวิ่งคอยล์ไมโครโฟน (Moving Coil Microphone) เป็นไมโครโฟนชนิดขดลวดเคลื่อนที่ ทำหน้าที่เปลี่ยนคลื่นเสียงไปเป็นคลื่นสัญญาณไฟฟ้า โดยอาศัยคุณสมบัติของการเหนียวนำทางแม่เหล็กไฟฟ้า ซึ่งประกอบด้วยไดอะเฟรม (Diaphragm) ที่เป็นแผ่นโลหะบางๆ ติดกับขดลวดเหนี่ยวนำ เมื่อคลื่นเสียงกระทบกับไดอะเฟรมที่ติดอยู่กับขดลวด จะเกิดการเคลื่อนที่ของขดลวดในสนามแม่เหล็กไฟฟ้า และสร้างความเข้มของเสียงที่กระทบกับไดอะเฟรมอย่างเป็นสัดส่วน ทำให้เกิดเป็นสัญญาณเสียง

        เป็นไมโครโฟนที่ประกอบด้วยไดอะเฟรมที่มีลักษณะคล้ายกับแผ่นเก็บประจุไฟฟ้าที่เป็นโลหะบางๆ 2 แผ่นวางขนานกันเมื่อมีเสียงมากระทบแผ่นโลหะบางๆ ของคอนเดนเซอร์เกิดการเคลื่อนที่ ซึ่งเป็นผลทำให้ค่าความจุไฟฟ้าของคอนเดนเซอร์เปลี่ยนไปจนเกิดค่าแรงดันไฟฟ้าของศัญญาณเสียง

        นอกจากนี้ยังสามารถแบ่งชนิดของไมโครโฟนตามทิศทางการรับเสียงได้เป็น 3 ชนิด ได้แก่ ไมโครโฟนชนิดรับเสียงรอบทิศทาง (Omni Directional Microphone) ไมโครโฟนชนิดรับสียงแบบสองทิศทาง (Bi Directional Microphone) และไมโครโฟนชนิดรับเสียงแบบทิศทางเดียว (Uni Directional Microphone)

        ไมโครโฟนชนิดนี้นิยมนำมาใช้สำหรับบันทึกเสียงจากแหล่งกำเนิดเสียงหลายทิศทาง ประกอบด้วยตู้เก็บไดอะแฟรม ที่อยู่ภายในไมโครโฟนเมื่อเสียงเดินทางมาจากแหล่งกำเนิดแบบรอบทิศทาง และเคลื่อนที่ผ่านเข้าสู่ช่องที่เปิกไว้เพื่อรับเสียง เสียงที่กระทบกับไดอะแฟรมจะทำให้เกิดการสั่น และถูกแปลงเป็นสัญญานไฟฟ้า

        ไมโครโฟนชนิดนี้สามารถรับเสียงได้เพียง 2 ทิศทาง คือ เสียงที่มาจากด้านหน้า และด้านหลังไมโครโฟน นิยมใช้ในการบันทึกเสียงที่มาจากแหล่งกำเนิด 2 ทิศทางพร้อมกัน เช่น การสนทนาระหว่างบุคคล 2 คนที่นั่งตรงข้ามกัน ภายในไมโครโฟนประกอบด้วยตู้เก็บไดอะแฟรม และช่องที่เปิดไว้เพื่อรับเสียงทั้งสองด้าน เสียงจะถูกสร้างจากด้านหน้าของไมโครโฟนที่มุม 0 องศา ผ่านเข้ามาในช่องที่เปิดไว้ช่องแรกทำให้เกิดการสั่นที่ไดอะแฟรม ต่อจากนั้นเสียงจะเดินทางไปที่ส่วนหลักของไมโครโฟน และผ่านเข้ามาในช่องที่เปิดด้านหลังที่มุม 80 องศา

        ไมโครโฟนชนิดนี้ถูกออกมาเพื่อบันทึกเสียงจากแหล่งกำเนิดเสียงเพียงแหล่งเดียว เช่น เสียงพูดของแต่ละคนเป็นต้น โดยมีโครงสร้างเหมือนกับไมโครโฟนชนิดรับเสียงแบบสองทิศทาง แต่สามารถรับเสียงได้เพืยงทิสทางเดียวจากด้านหลังของไมโครโฟน ภายในประกอบด้วยวัติถุที่มีลักษณะคล้ายโฟมหรือผ้าที่ติดอยู่กับไดอะแฟรม เพื่อใช้ในการดูดซับพลังงานเสียงที่ผ่านเข้ามาในช่องที่เปิดไว้ เพื่อสร้างเป็นพลังงานไฟฟ้าจากส่วนหน้าของไมโครโฟนที่กระทบกับไดอะแฟรมโดยตรง

เครื่องขยายเสียง (Amplifier)

        เครื่องขยายเสียง (Amplifier) เป็นอุปกรณ์สำหรับการขยายสัญญาณอินพุตให้มีความดังหรือแอมพลิจูตเพิ่มขึ้นโดยเครื่องขยายเสียงจะประมวลผลสัญญาณโดยใช้ชุดของทรานซิสเตอร์ที่เชื่อมต่ออยู่บนแผงวงจรและใช้พลังงานจากพาวเวอร์ซับพลาย โดยสัญญาณอินพุตจะถูกขยายให้มีแอมพลิจูตเพิ่มขึ้นแต่มีรูปแบบคลื่อนเหมือนเดิม

ลำโพง Speaker

        ลำโพง Speaker เป็นอุปกรณ์ที่ใช้สำหรับแปลงพลังงานทางไฟฟ้ากลับเป็นพลังงานเสียง ซึ่งมีฟังก์ชันการทำงานตรงข้ามกับไมโครโฟนหรือเครื่องขยายเสียง โดยจะทำหน้าที่ได้รับมาจากเครื่องขยายเสียง สามารถแบ่งลำโพงออกเป็น 2 ชนิดได้แก่ ลำโพงแบบไดนามิก (Dynamic Speaker) และลำโพงชนิดเสียงทุ้ม (Woofer) กับลำโพลงชนิดเสียงแหลม (Tweeter)

        ลำโพงแบบไดนามิก (Dynamic Speaker) ประกอบด้วยขดลวด (Wire Coil) และกรวยกระดาษ (Paper Cone) ที่ทำจากกระดาษ (Paper) หรือ ไฟเบอร์ (Fiber) เรียกว่าไดอะแฟรม ซึ่งติดกับขดลวด เมื่อสัญญาณไฟฟ้าจากแหล่งกำเนิดเสียงเดินทางผ่านขดลวด จะทำให้เกิดสนามไฟฟ้ารอบขดลวด และพื้นผิวของไดอะแฟรมจะเกิดการสั่นตามความถี่ของสัญญาณไฟฟ้าจนเกิดเป็นเสียง

        เสียงที่ออกจากลำโพงสามารถแบ่งออกเป็น 2 ระดับ คือ 1) ระดับเสียงทุ้ม (Woofer) เป็นเสียงที่มีความถี่ต่ำประมาณ 20 ถึง 400 เฮิรตซ์ หรือเรียกว่า เสียงเบส (Bass)”  โดยจะมีกรวยที่มีเส้นผ่านสูญกลางระหว่าง 5 ถึง 18 นิ้ว ลำโพงชนิดนี้จึงมีขนาดใหญ่ และ 2) ระดับเสียงแหลม (Tweeter) เป็นเสียงที่ใความถี่สูงอยู่ในช่วงระหว่าง 4 ถึง 20 กิโลเฮิรตซ์ ความถี่สูงสุดของเสียงเรียกว่า ระดับเสียงสูงสุด” (Treble) ซึ่งจะใช้กรวยที่มีเส้นผ่านสูญกลาง1.5 นิ้ว หรือน้อยกว่า ลำโพงชนิดนี้จึงมีขนาดเล็ก

อุปกรณ์ผสมสัญญาณเสียง (Audio Mixer)

        อุปกรณ์ผสมสัญญาณเสียง (Audio Mixer) เป็นเครื่องมือสำหรับบันทึก และแก้ไขเสียงในแต่ละแทร็กได้อย่างอิสระ เช่น สามารถควบคุมระดับของเสียง (Volumn) จังหวะ (Tempo) และระงับเสียง (Mute) ซึ่งการแก้ไขและจัดการแทร็กเสียงต่างๆ จะไม่ส่งผลกระทบต่อแทร็กอื่นๆ นอกจากนี้ยังสามารถเพิ่มเอฟเฟ็กต์เสียงแบบพิเศษ เช่น เสียงคอรัส เสียงเอคโค หรือเสียงจากอุปกรณ์ไฟฟ้าได้ จากนั้นแทร็กเหล่านี้จะถูกผสมผสานในช่องสัญญาณ หากเป็นระบบเสียงสเตอริโอจะใช้ 2 ช่องสัญญาณ แต่ถ้าเป็นระบบเสียงเซอราวด์จะใช้มากกว่า 2 ช่องสัญญาณขึ้นไป

ประเภทของเสียง

        ประเภทของเสียงสามารถแบ่งได้ 2 ประเภท คือ เสียงแบบมิดี้ และเสียงแบบดิจิตอล โดยมีรายละเอียด ดังนี้

มิดี้ (MIDI: Musical Instrument Digital Interface)

        มิดี้ (MIDI) คือเสียงที่แทนเครื่องดนตรีชนิดต่างๆ ซึ่งได้รับการพัฒนามาตั้งแต่ปี ค.ศ. 1980 สำหรับใช้กับเครื่องดนตรีอิเล็กทรอนิกส์และคอมพิวเตอร์ เช่น สร้างเสียงตามเครื่องเล่นเปียโน เป็นต้น โดยในมุมของนักดนตรี มิดี้ หมายถึง โน้ตเพลงที่มีรูปแบบเป็นสัญลักษณ์หรือตัวเลขที่บอกให้รู้ว่าต้องเล่นตัวโน๊ตใดด้วยระยะเวลาเท่าไหร่ เพื่อให้เกิดเป็นเสียงดนตรี ดนตรีแบบมิดี้จะไม่เหมือนเสียงจากเครื่องดนตรีจริงๆ ดังนั้น จึงจำเป็นต้องสร้างและปรับเสียงมิดี้ให้มีความไพเราะมากยิ่งขึ้น โดยไมโครซอฟต์ได้กำหนดมาตรฐานของเสียงแบบมิดี้ขึ้นมา เรียกว่า GM (General MIDI Standard) ซึ่งใช้กำหนดรูปแบบของการสร้างข้อมูลเสียงแบบ MIDI เพื่อให้การเล่นเสียง (Playback) บนอุปกรณ์ต่างๆเป็นมาตรฐานเดียวกัน

        ข้อดีของมิดี้ คือ ไฟล์ข้อมูลมีขนาดเล็ก การสร้างข้อมูลมิดี้ไม่จำเป็นต้องใช้เครื่องดนตรีจริงๆ ใช้หน่วยความจำน้องทำให้ประหยัดพื้นที่บนฮาริดดิสก์ เหมาะสำหรับใช้งานบนระบบเครือข่าย และง่ายต่อการแก้ไขและปรับปรุง ส่วนข้อเสียคือการแสดงผลได้เฉพาดนตรีบรรเลงและเสียงที่เกิดจากโน้ตดนตรีเท่านั้น

ดนตรีแบบดิจิตอล (Digital Audio)

        ดนตรีแบบดิจิตอล (Digital Audio) คือสัญญาณเสียงที่ส่งมากจากไมโครโฟนหรือเล่นเทป หรือจากแหล่งกำเนิดเสียงต่างๆ ทั้งจากธรรมชาติ และที่สร้างขึ้นเอง และนำข้อมูลที่ได้มาแปลงเป็นสัญญาณดิจิตอล ข้อมูลจะถูกสุ่มให้อยู่ในรูปแบบของบิตข้อมูล โดยเรียกอัตราการสุ่มข้อมูลที่ได้มาว่า “Sampling Rate” และจำนวนของข้อมูลที่ได้เรียกว่า “Sampling Size” ซึ่งจะเป็นตัวกำหนดคุณภาพของเสียงดิจิตอล เสียงแบบดิจิตอลจะมีขนาดข้อมูลใหญ่ ทำให้ต้องใช้หน่วยความจำและทรัพยากรในการประมวลผลมากกว่ามิดี้ แต่จะแสดงได้หลากหลายและเป็นธรรมชาติมากกว่า

        การเข้ารหัสเสียงลงบน CD เพลงทั่วไปให้มีคุณภาพสูงจะต้องได้มาตรฐาน ISO 10149 หรือที่เรียกว่ามาตรฐาน “Red Book” มาตรฐานนี้ได้กำหนด Sampling Rate ไว้ที่ 44.1 KHz และ Sampling Size อยู่ที่ 16 บิต ซึมาตรฐานดังกล่าวยังถูกใช้มาจนถึงปัจจุบัน

        โดยทั่วไปเสียงดิจิตอลจะอยู่ในช่วงความถี่ 44.1 kHz, 22.5 kHz และ 11.025 kHz ซึ่งมีขนาดการสุ่มสัญญาณ (Sampling Size) เป็น 8 และ 16 บิต โดยที่อัตราการสุ่มและขนาดการสุ่มที่สูงกว่าจะให้คุณภาพของเสียงที่ดีกว่า แต่จะต้องใช้เนื้อที่บนฮาร์ดดิสก์เพื่อเก็บข้อมูลมากขึ้น โดยคุณภาพของสัญญาณดิจิตอลจะขึ้นอยู่กับปัจจัยต่างๆ ดังนี้

        อัตตราการสุ่มเสียงมีผลโดยตรงต่อคุณภาพของเสียง ใช้อัตราการสุ่ม 8 กิโลเฮิรตซ์ หมายถึงสุ่มค่าแอมพลิจูดของคลื่นเสียงจำนวน 8,000 ครั้งต่อวินาที

        การเพิ่มอัตราการสุ่มและความละเอียดในการสุ่ม จะทำให้ไฟล์มีขนาดใหญ่ขึ้นและต้องการพื้นที่สำหรับจัดเก็บข้อมูลมากขึ้น รวมถึงต้องการหน่วยประมวลผลที่มีประสิทธิภาพสูงด้วย ตัวอย่างเช่น ไฟล์เพลงที่มีอัตราสุ่ม 22.05 กิโลเฮิรตซ์ และมีความละเอียดอยู่ที่ 16 บิตในโหมดสเตอริโอ ถ้าสียงมีความยาว 30 วินาที สามารถคำนวนพื้นที่จัดเก็บได้ดังนี้

(22,050 samples/sec)*(30 sec)*(16 bit/sample)*(2 channels)

        ผลลัพธ์ที่ได้จะเท่ากับ 21,168,000 บิต ถ้าแปลงเป็นไบต์จะได้ (21,168,000/8) = 2,646,000 ไบต์ ซึ่งเท่ากับ (2,646,000/1,024) = 2,584 กิโลไบต์

อุปกรณ์สำหรับความคุมและบันทึกเสียง

        อุปกรณ์ที่สำคัญและเกี่ยวข้องกับการควบคุมและบันทึกไฟล์เสียง ได้แก่ การ์ดเสียง (Sound Card) อุปกรณ์ถ่ายทอดสัญญาณเสียง (Audio Transmission) และอุปกรณ์บันทึกเสียง (Audio Recording Device)

การ์ดเสียง (Sound Card)

        การ์ดเสียง (Sound Card) เป็นอุปกรณ์ควบคุมเสียงที่สามารถเพิ่มลงในสล็อต PCI หรือ PCI Express บนเมนบอร์ดของเครื่องคอมพิวเตอร์ โดยจะเชื่อมต่อละทำงานร่วมกับอุปกรณ์ต่างๆ บนคอมพิวเตอร์ เช่น ซีพียู และลำโพง แต่ในปัจจุบันได้มีการผลิตการ์ดเสียงที่ใช้เชื่อมต่อจากภายนอกผ่านพอร์ตต่างๆได้ เช่น พอร์ต USB หรือ PCMCIA เป็นต้น

องค์ประกอบสำคัญของการ์ดเสียงมี ดังนี้

องค์ประกอบพื้นฐานที่อยู่ภายในการ์ดเสียง ได้แก่

การประมวลผลไฟล์เสียง (Processing Audio File)

                การประมวลผลไฟล์เสียงมีอยู่ 2 ชนิด ดังนี้

อุปกรณ์ถ่ายทอดสัญญาณเสียง (Audio Transmission)

        การถ่ายทอดข้อมูลเสียงระหว่างอุปกรณ์ที่ต่างกัน ต้องอาศัยอุปกรณ์ที่ใช้ถ่ายทอดสัญญาณเสียงระหว่างผู้รับและผู้ส่ง ซึ่งมีรูปแบบเดียวกัน โดยอุปกรณ์สำหรับถ่ายทอดสัญญาณเสียงที่สำคัญมีดังนี้

เป็นคอนเน็คเตอร์สำหรับการเชื่อมต่อที่ใช้ทั่วไป มีทั้งขนาด 2.5 มิลลิเมตร 3.5 มิลลิเมตร และ 6.5 มิลลิเมตร ในอดีตจะใช้ตัวเชื่อมต่อขนาด 6.5 มิลลิเมตร เพื่อแลกเปลี่ยนข้อมูลเสียงทางโทรศัพท์ ส่วนตัวเชื่อมต่อขนาด 3.5 มิลลิเมตรและ 2.5 มิลลิเมตร เป็นตัวเชื่อมต่อขนาดเล็กซึ่งถูกออกแบบมาเพื่อใช้ถ่ายทอกเอาท์พุตของสัญญาณเสียงจากวิทยุแบบทรานซอสเตอร์ ทั้ง 3 ขนาดสามารถทำงานได้ทั้งในระบบเสียงแบบโมโน และระบบเสียงสเตริโอ

ตัวเชื่อมต่อแบบ RCA เป็นตัวเชื่อมต่อสำหรับถ่ายทอดสัญญาณเสียงและวีดีโอจากอุปกรณ์ที่ใช้ภายในบ้าน พัฒนาโดย Radio Corporation of America (RAC) หัวเชื่อมต่อหรือปลั๊กตัวผู้ (Plug) ประกอบด้วยวงแหวนที่เป็นโลหะอยู่ส่วนกลางของปลั๊กมีพลาสติกขนาดเล็ก

ตัวเชื่อมต่อแบบ XLR ได้รับการพัฒนาโดย Cannon มีหลายรูปแบบ โดยรุ่น XLR3 ประกอบด้วย 3 ขา ใช้สำหรับไมครโฟนที่มีคุณภาพสูง ซึ่งขาที่ 1 จะเป็น Ground ส่วนขาที่ 2 และ 3 จะเป็นขั้วไฟฟ้า

อุปกรณ์บันทึกเสียง (Audio Recording Device)

        ในปัจจุบันมีอุปกรณ์ที่ใช้สำหรับจัดเก็บ และบันทึกข้อมูลเสียงหลากหลายชนิด ดังนี้

        ซีดี (CD: Compact Disc) หรือออดิโอซีดี (Audio-CD) ได้รับการพัฒนาโดย Philip และ Sony ซึ่ง        เป็นออปติคอลดิสก์ ใช้สำหรับจัดเก็บข้อมูลดิจิตอล (เช่น ไฟล์เสียงจิติอล เป็นต้น) โดยมีอัตรา        สุ่มเสียงดิจิติอลที่ 44.1 กิโลเฮิรตซ์ ด้วยขนาด 16 บิต ขนาดของแผ่นดิสก์จะมีเส้นผ่านศูนย์กลาง        อยู่ที่ 120 มิลลิเมตร และสามารถบันทึกเสียงได้ถึง 74 นาที

        เป็นเทปเสียงจิติอลที่มีขนาดเล็ก ซึ่งสามารถจัดเก็บเสียงดิจิตอลได้ด้วยอัตราสุ่มหลายรูปแบบ         เช่น 32 กิโลเฮิรตซ์ 44.1 กิโลเฮิรตซ์ และ 48 กิโลเฮิรตซ์ เป็นต้น สามารถจัดเก็บข้อมูลดิจิตอล        ต้นฉบับได้อย่างถูกต้องแม่นยำ

        เป็นเทปแม่เหล็กที่ใช้สำหรับจัดเก็บและสำรองข้อมูลที่พัฒนาต่อจากเทคโนโลยี Digital Audio         Tape (DAT) ในปี ค.ศ. 1989 โดย Sony และ Hewlett Packard ได้พัฒนา DSS เพื่อใช้สำหรับ        จัดเก็บข้อมูลที่มีลักษณะคล้ายเทป DAT โดยเทปมีความกว้าง 4 มิลลิเมตร และยาวตั้งแต่ 60 –         90 เมตร มีอายุการใช้งานอย่างน้อย 10 ปี นอกจากนี้ยังเพิ่มเทคโนโลยี Helical Scanning เพื่อใช้        สำหรับบันทึกข้อมูลได้อย่างเร็วขึ้น

        พัฒนาขึ้นในปี ค.ศ. 1990 โดย Philip ซึ่งมีลักษณะเหมือนกับ Compact Audio Cassette แต่        สามารถรองรับการบันทึกข้อมูลดิจิตอลได้ โดยผู้ใช้สามารถส่งข้อมูลในรูปแบบดิจิตอลเพื่อ        บันทึกในเทปอนาล็อกได้ ระยะห่างระหว่างแทร็กใกล้กันมากกว่า DAT แต่ความจุข้อมูลน้อยกว่า         DCC น้อยกว่า DAT ดังนั้น จึงให้คุณภาพเสียงที่ดีกว่า

        ในปี ค.ศ. 1991 Sony ได้พัฒนา MiniDisc (MD) ซึ่งเป็นอุปกรณ์ที่สามารถจัดเก็บข้อมูลได้ทุก        ชนิดด้วยการบันทึกในรูปแบบ Magnetic Optical ซึ่งสามารถบันทึกข้อมูลได้ถึง 1 ล้านครั้ง และ        บันทึกได้นานถึง 60-80 นาที โดยเข้าถึงข้อมูลด้วยการสุ่มในรูปแบบของ Table Of Content         (TOC) ซึ่งจัดเก็บข้อมูลเริ่มต้นที่ตำแหน่งแทร็ก และบล็อกที่ต่างกันอย่างอิสระ อุปกรณ์ที่ใช้งาน        กับ MiniDisc จะมีกลไกการป้องกันการคัดลอกที่เรียกว่า “Serial Copy Management System         (SCMS)” ซึ่งป้องกันการคัดลอกเพลง และป้องกันการอ่านข้ามดิสก์ ที่เกิดจากการกระแทก         หรือการสั่นของเครื่องเล่น ด้วยการพักข้อมูลทั้งหมดไว้ในบัฟเฟอร์

การประมวลผลไฟล์เสียง (Processing Sound)

        การประมวลผลไฟล์เสียง (processing Sound) คือ กระบวนการต่างๆตั้งแต่นำไฟล์เสียงเข้าสู่โปรแกรมสำหรับสร้าหรือแก้ไขเสียงโดยเฉพาะ เช่น โปรแกรม MidiNotate เป็นต้น จากนั้นจะปรับแต่ง แก้ไข หรือเพิ่มเติมตัวโน้ตต่างๆเข้าไปตามความต้องการ แล้วทำการทดสอบเสียงที่ได้ และนำไฟล์เสียงไปใช้งานต่อไป ปัจจุบันโปรแกรมเกี่ยวกับการบันทึกเสียงและโปรแกรมที่ช่วยในการทำงานกับเสียงจะมีขีดความสามารถในการทำงานสูงมากขึ้น ในขณะที่อุปกรณ์ฮาร์ดแวร์สำหรับใช้ในการสนับสนุนในการทำงานเกี่ยวกับเสียงนั้น ยังมีความสามารถไม่เพียงพอที่จะรองรับการทำงานเหล่านี้ได้ หรืออาจมีราคาสูงเกินไปทำให้เกิดข้อจำกัดการสร้างไฟล์เสียงที่มีประสิทธิภาพมากขึ้น การประมวลผลไฟล์เสียงมีขั้นตอน ดังนี้

การบันทึกหรือการนำเข้าข้อมูลเสียง

การบันทึกเสียง เป็นการนำเสียงที่ได้จากการพูด การเล่นเครื่องดนตรีหรือเสียงจากแหล่งต่างๆ เช่นเสียงน้ำตก ฟ้าร้อง หรือเสียงสัตว์ มาทำการจัดเก็บลงในหน่วยความจำ เพื่อนำไปใช้งานตามต้องการ ตัวอย่างเช่น การบันทึกเสียงบรรยายของนักพากย์ เพื่อใช้ในการเพิ่มเสียงลงในภาพยนตร์การ์ตูน เป็นต้น โดยคุณภาพเสียงที่บันทึกจะขึ้นอยู่กับฮาร์ดแวร์และซอร์ฟแวร์มที่ใช้ในการบันทึก ซึ่งเสี่ยงที่ได้จากการบันทึกสามารถแบ่งได้เป็น 2 รูปแบบ คือ Synthesize Sound เป็นเสียงที่เกิดจากตัววอเคราะห์เสียง ที่เรียกว่ามิดี้ โดยข้อมูลของตัวโน้ตจะถูกส่งไปยัง Synthesize Chip เพื่อทำการแยกเสียงว่าเป็นเสียงดนตรีชนิดใด ส่วนเสียงอีกรูปแบบคือ Sound Data เป็นเสียงที่ได้จากการแปลงสัญญาณอนาล็อกเป็นสัญญาณดิจิตอล ซึ่งมีขนาดของไฟล์ใหญ่กว่าเสียงชนิดแรก

        สิ่งสำคัญก่อนบันทึกเสียง คือ จะต้องทำการเลือก Sampling Rate เพื่อให้ได้เสียงที่ต้องการและใกล้เคียงกับเสียงจริง โดยจะต้องพิจารณาจากขนาดของไฟล์ (File Size) และขนาดของช่องสัญญาณที่ใช้รับส่งไฟล์เสียงด้วยถ้าค่า Sampling Rate มากจะใช้พื้นที่ในการจัดเก็บข้อมูลเพิ่มขึ้นตามไปด้วย นอกจากการบันทึกเสียงแล้ว การนำเข้าเสียง (Importing Sound) ก็เป็นอีกทางเลือกหนึ่งที่ทำให้การทำงานละดวกรวดเร็วขึ้นโดยการนำไฟล์เสียงที่มีอยู่แล้วมาใช้งาน หากต้องการนำเข้าเสียงจากแผ่นซีดี จะต้องใช้ซอร์ฟแวร์ที่เหมาะสม และรองรับการทำงานกับไฟล์เสียงในรูปแบบดังกล่าว

หากกำหนดอัตรา Sampling Rate สูง ความถูกต้องของข้อมูลเสียงที่ทำการบันทึกจะสูงตามไปด้วย ซึ่งเรียกว่า ความละเอียดของเสียง หากต้องการคุณภาพของเสียงดี ขนาดแฟ้มของข้อมูลจะใหญ่ขึ้นตามไปด้วย การบันทึกเสียงแบบสเตริโอจะให้คุณภาพเสียงที่ฟังแล้วสมจริงมากขึ้น และเมื่อเปรียบเทียบกับการบันทึกเสียงแบบโมโนซึ่งใช้ระยะเวลาบันทึกเท่ากัน ข้อมูลเสียงแบบสเตริโอจะใช้พื้นที่มากกว่าข้อมูลเสียงแบบโมโน

การแก้ไขและการเพิ่มเทคนิคพิเศษ

        การแก้ไขไฟล์เสียง (Sound Editing) คือ การตัดต่อ และการปรับแต่งเสียง โดยสิ่งสำคัญในการแก้ไขเสียง คือ การจัดสรรเวลาของการแสดงผลให้สัมพันธ์กับองค์ประกอบต่างๆ ที่ใช้งานร่วมกับเสียง เช่น การตัดต่อเสียงสำหรับนำมาใช้ในการนำเสนอไฟล์วีดีโอ ผู้ตัดต่อจะต้องแสดงภาพของวีดีโอให้สัมพันธ์กับเสียง เป็นต้น ในปัจจุบันมีซอร์ฟแวร์สำหรับแก้ไข ปรับแต่ง หรือเพิ่มเทคนิคพิเศษให้มัลติมีเดีย (เสียง ภาพ และวีดีโอ เป็นต้น) มีความสมบูรณ์ และน่าสนใจมากยิ่งขึ้นเป็นจำนวนมาก

รูปแบบไฟล์เสียง

        การจัดเก็บไฟล์เสียงสามารถทำได้หลายรูปแบบ โดยรูปแบบของการบีบอัดไฟล์เสียงจะมี 2 วิธี คือ “Lossless Compression” เป็นไฟล์เสียงที่รักษาข้อมูลไว้อย่างครบถ้วน ไม่มีการสูญหายของข้อมูล ไฟล์ชนิดนี้จะมีขนาดใหญ่ แต่คุณภาพเสียงดี ส่วนอีกวิธี คือ Lossy Compression วิธีนี้จะตัดข้อมูลเสียงบางส่วนออกไป ทำให้รายละเอียดของเสียงหายไป แต่ไฟล์จะมีขนาดเล็ก โดยไฟล์เสียงแต่ละชนิดจะมีรายละเอียด รูปแบบการบีบอัดข้อมูล และลักษณะการนำไปใช้งานที่ต่างกัน ดังนี้

บริษัท Microsoft และ IBM ได้ร่วมกันพัฒนาไฟล์เสียง WAV ที่สนับสนุนการใช้งานบนแพล็ตฟอร์มของ Windows และ Mac OS รวมทั้งสามารถนำไปใช้งานบนเวิลด์ไวด์เว็บ (WWW) ได้ด้วย โดยไฟล์ WAV จะไม่มีการบีบอัดข้อมูล (Lossless Compression) ทำให้เสียงมีคุณภาพสูง แต่ไฟล์จะมีขนาดใหญ่ นิยมนำมาแปลงเป็นไฟล์ MP3 เพื่อทำให้มีขนาดเล็กลง

Audio Interchange File Format (AIFF) เป็นรูปแบบไฟล์มาตรฐานที่ใช้จัดเก็บข้อมูลเสียงบนเครื่องคอมพิวเตอร์ของ Apple Macintosh ไฟล์ AIFF จะไม่มีการบีบอัดข้อมูล (Lossless Compression) ทำให้ไฟล์มีขนาดใหญ่ แต่คุณภาพเสียงดี โดยสามารถบันทึกเสียงได้ที่ความละเอียดตั้งแต่ 8 bit/22 เฮิรตซ์ ถึง 24 bit/96 กิโลเฮิรตซ์ ทั้งแบบโมโนและสเตอริโอ

ไฟล์มิดี้เป็นไฟล์เสียงที่ถูกสร้างจากชิปสังเคราะห์เสียงดิจิตอล (Synthesizer Chip) โดยเสียงที่ได้จะเหมือนกับเสียงจากเครื่องดนตรี ไฟล์เสียงมิดี้จะมีขนาดเล็ก เหมาะสำหรับใช้งานบนเว็บแอพลิเคชันและใช้งานได้ทั้งแพล้ตฟอร์มของ Mac OS และ Windows ไฟล์ข้อมูลแบบมิดี้จะมีนามสกุล .MID (MusicalInstrument DigitalInterface)

ไฟล์เสียง AU (Audio) พัฒนาโดย Sun และ Microsoft ประกอบด้วย (Header) ในระบบยูนิกซ์ ได้มีการใช้งานไฟล์ข้อมูลเสียงแบบ .au โดยเป็นเสียงที่เลียนแบบเสียงโทรศัพท์ (International Telephone Format) ใช้ในการส่งข้อความผ่านระบบเครือข่าย

ไฟล์ MP3 เป็นไฟล์เสียงที่พัฒนามากจากมาตรฐานของ MPEG (Motion Picture Expert Group) สำหรับใช้งานกับเครื่องเล่นที่สามารถรองรับไฟล์ MP3 ได้รวมถึงนำมาใช้งานบนเครือข่ายอินเทอร์เน็ต ไฟล์ประเภทนี้มีการบีบอัดข้อมูล 3 ระดับ แต่ไฟล์มีคุณภาพเสียงที่ดีแม้ว่าจะมีขนาดเล็ก เนื่องจากใช้วิธีบีบอัดข้อมูลที่มีประสิทธิภาพ ทำให้ไฟล์เสียงมีคุณภาพสูงเทียบเท่ากับคุณภาพเสียงบนซีดี

ไฟล์ VOC (Voice) ใช้กับการ์ดเสียงแบบ Sound Blaster ในระบบสเตอริโอขนาด 16 บิต ซึ่งอาจอยู่ในรูปแบบคลิปเสียง เสียงเอฟเฟ็กต์ต่างๆ หรือเสียงเครื่องดนตรี โดยสามารถเล่นไฟล์ VOC กับโปรแกรมต่างๆ ได้ เช่น Winamp, Voc2wav Converter และ dBpoweramp decoder

ไฟล์ WMA เป็นไฟล์เสียงที่พัฒนาโดยไมโครซอฟต์ มีลักษณะคล้ายกับไฟล์ MP3 แต่จะมีขนาดเล็กกว่า โดยไฟล์ที่มีนามสกุลเป็น “.wma” สามารถเปิดกับโปรแกรม Windows Media Player หรือ Winamp ได้ นอกจากนี้ยังมีการพัฒนาให้สามารถใช้งานกับระบบปฏิบัติการ Linux ได้อีกด้วย

เป็นไฟล์ที่พัฒนาโดย Real Network ให้สามารถส่งข้อมูลเสียงในรูปแบบสตรีมมิ่งได้ การให้บริการของสถานีวิทยุบนเครือข่ายอินเทอร์เน็ตจะใช้ Real Audio ในการส่งสัญญาณแบบ Real Time ข้อมูลเสียงจะถูกเล่นทันทีโดยไม่ต้องรอให้โหลดข้อมูลทั้งหมดเสร็จก่อน

ใช้วิธีบีบอัดข้อมูลแบบ Lossy Compression ซึ่งคล้ายกับไฟล์ MP3 ได้รับการพัฒนาโดย ISO และ IEC โดยใช้พื้นฐานจาก MPEG-2 และ MPEG-4 ไฟล์ ACC สามารถใช้ได้กับอุปกรณืบางชนิดได้แก่ Apple’s iPhone, iPod และ iTunes รวมทั้ง Sony Playstation 3 และ Nitendo Wii

        เป็นไฟล์ที่บีบอัดข้อมูลแบบ Lossless Compression และส่งข้อมูลในรูป Real Time โดยใช้อัลกอริทึมที่สามารถเข้ารหัสและถอดรหัสได้อย่างรวดเร็ว สามารถนำไปคอมไพล์และเอ็กซิคิวต์บนแพล็ตฟอร์มที่แตกต่างกันได้ โดยทั่วไปสามารถบีบอัดเพื่อลดขนาดไฟล์ได้ 30-70% โดยไฟล์ TTA มีคุณสมบัติเด่นมากมาย เช่น เป็นไฟล์ที่เรียบง่าย ใช้งานฟรี และมี Plug-in จำนวนมาก

ซอร์ฟแวร์สำหรับเล่นไฟล์ออดิโอ

ในปัจจุบันซอร์ฟแวร์ที่ใช้เล่นไฟล์เสียงมีอยู่มากมาย ซึ่งบางซอร์ฟแวร์ก็สามารถแสดงได้ทั้งภาพและเสียง โดยหัวข้อนี้จะกล่าวถึงซอร์ฟแวร์ต่างๆที่สำคัญ ดังนี้

เป็นซอร์ฟแวร์ของระบบปฎิบัติการ Windows ที่ใช้สำหรับเล่นไฟล์เสียงและไฟล์วีดีโอบนเครื่องคอมพิวเตอร์ นอกจากนี้ยังสามารถนำไปใช้กับแพล็ตฟอร์มอื่นๆได้ เช่น Pocket PC , Mac OS , และ Solaris เป็นต้น ซึ่งสามารถเล่นไฟล์ได้หลากหลายชนิด เช่น WMV , WMA , ASF ,และ MP3 เป็นต้น

เป็นฟรีแวร์ที่พัฒนาโดยบริษัท Nullsoft ในปี ค.ศ.1997 สามารถปรับเปลี่ยนสกิน และเล่นไฟล์เสียงได้หลากหลายรูปแบบ เช่น MIDI, MP1, MP2 และ MP3 นอกจากนี้ยังสามารถเพิ่ม Plug-In อื่นๆได้ เช่น Sound Effect ด้วย DSP Plug-In และ Visual Effect ด้วย AVS Plug-In เป็นต้น

เป็นฟรีแวร์ที่ใช้สำหรับเล่นไฟล์เสียงซึ่งมีลักษณะคล้ายกับ Winamp แต่ใช้งานบนระบบปฏิบัติการ UNIX และสามารถนำสกินของ Winamp มาใช้งานได้ โดยเวอร์ชั่นแรกของ XMMS ใช้ชื่อว่า X11 Amp สามารถรองรับไฟล์เสียง และไฟล์วีดีโอได้หลายรูปแบบ เช่น Audio CD , MPEG1 , MPEG2 , MPEG3 , Vorbis , WAV , WavPack , FLAC , และ WMA เป็นต้น

เป็นซอร์ฟแวร์สำหรับเล่นไฟล์เสียงและไฟล์วีดีโอบนเครือข่ายอินเตอร์เน็ตในรูปแบบสตรีมมิ่ง  ได้รับการพัฒนาโดย RealNetwork สามารถใช้งานได้หลายแพล็ตฟอร์ม เช่น Windows , Mac OS X , Linux , Unix , Palm OS และ Symbian OS รวมถึงสามารถนำไปใช้งานกับอุปกรณ์อื่นๆได้ เช่น Apple’s  ipod , MP3 Player และ Windows Media  Device

เป็นซอร์ฟแวร์สำหรับเล่นไฟล์เสียง และฟังวิทยุผ่านเครือข่ายอินเตอร์เน็ต พัฒนาโดย Musicmatch Inc. ซึ่งมี Media Library สำหรับจัดการกับมีเดียต่างๆ คล้ายกับ iTune ของ Apple สามารถเล่นไฟล์เสียงได้หลายรูปแบบภายในซอร์ฟแวร์จะประกอบด้วย CD Playback , Internet Radio และ Music Store รวมถึง Media Library ที่ใช้สำหรับจัดการไลบรารี่ของผู้ใช้และสามารถส่งข้อมมูลไปยัง iPod ได้

เป็นซอร์ฟแวร์ที่ประกอบด้วยฟังก์ชันสำหรับจัดการกับไฟล์เสียงมากมาย ได้แก่ Music Repository , Sorting และ Playback ที่พัฒนาโดย Korean Mother Company Cowon เป็นโปรแกรมที่สามารถเล่นไฟล์ได้หลายรูปแบบ เช่น Wav , Mp3 , Ogg , Wma , Mpg , Avi , Wmv , MIDI , RM , VideoCD , และ AudioCD เป็นต้น

เป็นซอร์ฟแวร์สำหรับเล่นไฟล์เสียง และไฟล์วีดีโอ ที่พัฒนาโดย Apple Computer โดยมี iTune Music Store เป็นคอมโพเนนต์ที่ให้ผู้ใช้สามารถสั่งซื้อไฟล์เพลงดิจิตอลจาก iTunes ได้ นิยมใช้กับเครื่องเล่น iPod ซึ่งสามารถดาวน์โหลดได้ฟรีและใช้งานร่วมกับระบบปฎิบัติการได้หลากหลาย ได้แก่ Mac OS X, Windows 2000 , Windows XP , และ Windows Srever 2003

        เป็นฟรีแวร์ที่พัฒนาโดย Quinnware ใช้งานบนระบบปฎิบัติการวินโดวส์ สามาถเล่นไฟล์เสียงได้หลากหลายรูปแบบ เช่น MP3, Ogg, WAV, และ CD Audio รวมถึงความสามารถในการเปลี่ยนสกิน รองรับ Rip CD และสามารถแปลงไฟล์ได้

เป็นฟรีแวร์ที่ใช้งานบนระบบปฎิบัติการ Windows สามารถรองรับรูปแบบไฟล์เสียงได้หลายชนิด ได้แก่ MP3, MP2, Ogg Vorbis, WAV, MOD, XM , Audio CD และ Windows Media Audio  นอกจากนี้ยังสามารถปรับเปลี่ยน

สกิน ถอดรหัสไฟล์ และมี Equalizer สำหรับปรับแต่งเสียง โดยมีลักษณะคล้ายกับโปรแกรม Winamp คือ สามารถดาวน์โหลดสกินและ Plug-in ไปติดตั้งเพิ่มเติมได้

เป็นฟรีแวร์ที่ใช้งานบนระบบปฎิบัติการ Windows สามารถเปลี่ยนสกินและเล่นไฟล์เสียงได้หลากหลายชนิด เช่น Ogg Vorbis, MP3, MP2, MP1, WMA, WAV, CDA, MOD และ XM

เป็นฟรีแวร์สำหรับเล่นไฟล์เสียงบน UNIX ที่มีพื้นฐานมาจาก XMMS Mutimadia Player   มีลักษณะคล้ายกับ Winampซึ่งสามารภปรับเปลี่ยนสกิน และสามารภรองรับรูปแบบไฟล์เสียงและไฟล์วีดีโอได้หลากหลาย ได้แก่ Audio CD , MPEG1 , MPEG2 , MPEG3 , Vorbis , WAV , WavPack , FLAC และ WMA

เป็น ซอร์ฟแวร์สำหรับเล่นไฟล์เสียงที่ประกอบด้วยเครื่องมือสำหรับจัดการไฟล์เสียง และรองรับรูปแบบไฟล์ได้หลากหลายชนิด ได้แก่ MP3, Ogg, FLAC, Monkey’s Audio และ CD Audio รวมทั้งสามารถรองรับ CD Ripper และเพิ่ม Plug-in API ให้กับซอร์ฟแวร์ได้

]

ออดิโอกับมัลติมิเดีย

วัตถุประสงค์หลักในการนำเสียงเข้ามาประยุกต์ใช้กับงานด้านมัลติมิเดีย คือ เพื่อให้เข้าใจถึงเนื้อหาที่ต้องการนำสนอและลดการสื่อสารข้อมูลในรูปแบบที่ซ้ำซ้อน (Redundancy) รวมถึงเพิ่มโอกาสการสื่อสารข้อมูลผ่านช่องทางที่หลากหลายยิ่งขึ้นก่อนจะนำเสียงมาใช้ควรทำความเข้าใจเกี่ยวกับเสียงประเภทต่างๆดังนี้

ประเภทของเสียงที่นำมาใช้กับงานด้านมัลติมิเดีย

        เสียงที่นำมาใช้กับงานด้านมัลติมิเดียมีหลายประเภท ได้แก่ เสียงพูด (Speech) เสียงเพลง (Music) เสียงเอฟเฟ็กต์ (Sound Effect) โดยมีรายละเอียดดังนี้

เสียงพูด(Speech)

เสียงพูด(Speech) เป็นองค์ประกอบสำคัญสำหรับการสื่อสารข้อมูลของมนุษย์ และเป็นสื่อกลางสำหรับถ่ายทอดข้อมูลที่มีประสิทธิภาพ สามารถใช้สื่อความหมายแทนตัวอักษรจำนวนมากได้ เสียงพูดแบ่งออกเป็น 2 ชนิดได้แก่ เสียงพูดแบบ ดิจิตอล (Digitized) และเสียงพูดแบบสังเคราะห์ (Synthesized)

  1. เสียงพูดแบบ ดิจิตอล(Digitized )เป็นเสียงพูดที่บันทึกมาจากมนุษย์ จัดเป็นเสียงที่มีคุณภาพสูง และต้องการพื้นที่สำหรับจัดเก็บข้อมูลมาก
  2. เสียงพูดแบบสังเคราะห์ (Synthesized) เป็นเสียงที่เกิดจากการสังเคราะห์ ซึ่งไม่สามารถแทนเสียงพูดของมนุษย์ได้อย่างสมบูรณ์

เสียงเพลง (Music)

เสียงเพลง (Music) นับเป็นองค์ประกอบที่สำคัญของการสื่อสารของมนุษย์เช่นเดียวกับเสียงพูด สามารถใช้เสียงเพลงเพื่อสื่อถึงอารมณ์ที่เกี่ยวข้องกับข้อมูลที่ต้องการนำเสนอได้ ซึ่งช่วยเพิ่มความน่าสนใจให้กับผู้ฟังได้ นอกจากนี้ยังสามารถนำมาผสมผสานกับเสียงพูด เพื่ออธิบายข้อมูลบนหน้าจอได้ดีกว่าการใช้ตัวอักษรเพียงอย่างเดียว

เสียงเอฟเฟ็กต์(Sound Effect)

        เสียงเอฟเฟ็กต์(Sound Effect) ถูกใช้สำหรับเพิ่ม หรืปรับปรุงเสียงให้มีความแปลกใหม่ รวมทั้งใช้เพิ่มลูกเล่นให้กับข้อมูล หรือคำสั่งได้ด้วย สามารภแบ่งออกเป็น 2 ประเภท ได้แก่ เสียงเอฟเฟ็กต์ธรรมชาติ (Natural) และเสียงเอฟเฟ็กต์สังเคราะห์ (Synthetic)

  1. เสียงเอฟเฟ็กต์ธรรมชาติ (Natural)เป็นเสียงที่เกิดจากแหล่งกำเนิดที่มีอยู่ตามธรรมชาติรอบๆ ตัวมนุษย์ เช่น เสียงนก น้ำตก หรือคลื่นในทะเล เป็นต้น
  2. เสียงเอฟเฟ็กต์สังเคราะห์ (Synthetic)เป็นเสียงที่เกิดจากการสังเคราะห์ด้วยกระบวนการทางอิเล็กทรอนิกส์ หรือสังเคราะห์จากมนุษย์ซึ่งแบ่งออกเป็น 2 ชนิด ได้แก่ เสียงเอฟเฟ็กต์ที่อยู่รอบๆ(Ambient Sound) และเสียงเอฟเฟ็กต์พิเศษ (Special Sound)

ขั้นตอนการนำเสียงมาใช้งาน

           ไม่ว่าจะใช้มัลติมีเดียบนระบบ Macintosh หรือ Windowsต้องมั่นใจว่าเมื่อนำเสียงไปใช้กับงานมัลติมีเดียแล้ว จะทำให้งานมีคุณภาพมากขึ้น โดยจะต้องพิจารณาถึงความเหมาะสมในการนำมาใช้งานตามขั้นตอนต่อไปนี้

  1. ตัดสินใจว่าจะใช้เสียงชนิดใดกับงานที่ออกแบบไว้ เช่น เพลง เสียงพิเศษประกอบการนำเสนอ หรือเสียงพูด
  2. เป็นต้น ซึ่งต้องกำหนดตำแหน่งหรือเวลาในการแสดงเสียงให้เหมาะสมด้วย
  3. ตัดสินใจว่าจะใช้เสียงแบบมิดี้ หรือใช้เสียงแบบดิจิตอลที่ไหนและเมื่อไหร่
  4. พิจารณาว่าจะสร้างข้อมูลเสียงขึ้นมาเองหรือซื้อสำเร็จรูปมาใช้งานจึงจะเหมาะสม
  5. นำไฟล์เสียงมาทำการปรับแต่งให้เหมาะสมกับมัลติมิเดียที่ออกแบบ แล้วนำมารวมเข้ากับงานมัลติมิเดียที่ทำการผลิต
  6. ทดสอบการทำงานของเสียงให้มั่นใจว่า เสียงที่นำเสนอมีความสัมพันธ์กับภาพในงานมัลติมเดียที่ผลิตขึ้น หากไม่สัมพันธ์กันต้องทำตามขั้นตอนที่ 1 ถึง 4 ซ้ำแล้วให้ทดสอบใหม่จนกว่าจะได้ผลลัพธ์ที่ดีที่สุด

        ในการรวมข้อมูลเสียงเข้ากับงานด้านมัลติมิเดียจะต้องคำนึงถึงซอรฟแวร์ที่ใช้งานทั่วไปด้วย หากว่าผู้ใช้นำมัลติมีเดียที่ผลิตไปใช้งานแล้วเกิดความผิดพลาด เช่น การแสดงเสียงไม่สัมพันธ์กับภาพหรือแสดงลไม่ได้ แสดงว่างานที่ผลิตไม่มีคุณภาพ ดังนั้น ผลลัพธ์ของงานที่ทำการผลิตจะต้องเป็นไปตามมาตรฐานตามที่ได้กำหนดเอาไว้ด้วย

สรุป

        เสียง(Audio) เป็นองค์ประกอบหนึ่งที่นิยมนำมาใช้กับงานด้านมัลติมีเดีย ซึ่งสามารถถ่ายทอดบรรยากาศและอารมณ์ต่างๆไปยังผู้ชมได้ ดังนั้น การเลือกใช้เสียงกับงานมัลติมีเดียอย่างเหมาะสมย่อมสร้างความรู้สึกที่ดีและน่าประทับใจแก่ผุ้ชมงานนำเสนอได้

เอกสารอ้างอิง

        ทวีศักดิ์ กาญจนสุวรรณ (2552).เทคโนโลยีมัลติมีเดีย (Multimedia Technology). กรุงเทพ:หจก.

                                 ไทยเจริญการพิมพ์.