Open Access. Powered by Scholars. Published by Universities.®

Social and Behavioral Sciences Commons

Open Access. Powered by Scholars. Published by Universities.®

Linguistics

Chulalongkorn University Theses and Dissertations (Chula ETD)

2022

Articles 1 - 7 of 7

Full-Text Articles in Social and Behavioral Sciences

Analyzing Two Opposing Opinions From Social Media Through Static And Contextualized Word Embeddings, Wassakorn Sarakul Jan 2022

Analyzing Two Opposing Opinions From Social Media Through Static And Contextualized Word Embeddings, Wassakorn Sarakul

Chulalongkorn University Theses and Dissertations (Chula ETD)

Public opinion analysis plays a vital role in various domains, such as marketing and politics. With the increasing volume of text data available through the internet and social media, efficient text-based analysis methods have become crucial. This study explores the application of static and contextualized word embeddings in word-based opinion analysis. The research questions focus on the impact of pre-training on static word embeddings, the efficacy of static and contextualized word embeddings in delineating opposing opinions, and the behavioral differences between the two embedding types. The findings suggest that pre-training improves embedding quality in small-sized datasets but may introduce noise …


Comparison Of The Inter-Accent Variation Of Articulation Rate Between English And English With Imitated Chinese Accent Speech, Komchit Taweesablamlert Jan 2022

Comparison Of The Inter-Accent Variation Of Articulation Rate Between English And English With Imitated Chinese Accent Speech, Komchit Taweesablamlert

Chulalongkorn University Theses and Dissertations (Chula ETD)

This paper compares the articulation rate of 2 English speeches with different accents produced by Nigel Ng, a well-known stand-up comedian and youtuber, while he is taking the role of Uncle Roger and while he is not. Taking the role of Uncle Roger, Nigel Ng produces utterances with imitated Chinese accent to underline stereotypical Asian characteristics, and to contrast with his own “neutralish English accent”. The objective is to investigate the variation of articulation rate between 2 accents which are both produced by only one speaker. Based on the analysis of the articulation rate of Nigel Ng’s speeches, it is …


อิทธิพลของสัทสมบัติและสัทบริบทที่มีต่อระดับความก้องและค่าความเข้มของพยัญชนะกักภาษาไทย: นัยยะต่อการแพร่ละอองลอย, ก้องเวหา อินทรนุช Jan 2022

อิทธิพลของสัทสมบัติและสัทบริบทที่มีต่อระดับความก้องและค่าความเข้มของพยัญชนะกักภาษาไทย: นัยยะต่อการแพร่ละอองลอย, ก้องเวหา อินทรนุช

Chulalongkorn University Theses and Dissertations (Chula ETD)

การศึกษาครั้งนี้มีวัตถุประสงค์เพื่อ 1) ศึกษาการแปรของค่าระดับความก้องในช่วงปิดฐานกรณ์และความชันของค่าความเข้มพลังลมของช่วงเปิดฐานกรณ์ของพยัญชนะกักที่มีสัทสมบัติและปรากฏในสัทบริบทที่แตกต่างกัน 2) ศึกษาปฏิสัมพันธ์ระหว่างค่าระดับความก้องในช่วงปิดฐานกรณ์และความชันของค่าความเข้มพลังลมของช่วงเปิดฐานกรณ์ในการออกเสียงพยัญชนะกักภาษาไทยที่มีสัทสมบัติและปรากฏในสัทบริบทที่แตกต่างกัน 3) อภิปรายนัยยะของผลการแปรและปฏิสัมพันธ์ของค่าระดับความก้องและความชันของค่าความเข้มพลังลมต่อการแพร่ของละอองลอย ในการวิเคราะห์การแปรของค่าทางกลสัทศาสตร์ เก็บข้อมูลเสียงของบอกภาษา 10 คนจากคำพูดต่อเนื่อง 48 คำที่ประกอบขึ้นจากพยัญชนะกักก้องและไม่ก้องภาษาไทยใน 2 สัทบริบท นอกจากนี้ นำผลของค่าทางกลสัทศาสตร์มาเชื่อมโยงกับนัยยะของการแพร่ละอองลอย ผลการศึกษาการแปรของค่าทางกลสัทศาสตร์พบว่า 1) เมื่อเรียงลำดับตามระดับความก้องของพยัญชนะกักมีรูปแบบเดียวกันทั้ง 2 สัทบริบท คือ กักก้อง > ก้กไม่ก้องพ่นลม > ก้กไม่ก้องไม่พ่นลม เมื่อเปรียบเทียบระหว่างสัทบริบทพบว่า ตำแหน่งระหว่างสระ > ตำแหน่งนำหน้าสระ ซึ่งความต่างของประเภทพยัญชนะกักและสัทบริบทมีนัยสำคัญทางสถิติที่ 0.05 2) เมื่อเรียงลำดับตามความชันของค่าความเข้มพลังลมของพยัญชนะกักมี 2 รูปแบบทั้ง 2 สัทบริบท คือ รูปแบบ 1 กักไม่ก้องไม่พ่นลม > ก้กไม่ก้องพ่นลม > ก้กก้อง และรูปแบบ 2 กักไม่ก้องพ่นลม > ก้กไม่ก้องไม่พ่นลม > ก้กก้อง ซึ่งมีความต่างของประเภทพยัญชนะกักอย่างมีนัยสำคัญทางสถิติที่ 0.05 แต่ไม่พบความต่างระหว่างสัทบริบท ผลการศึกษาปฏิสัมพันธ์ของระดับความก้องและความชันของค่าความเข้มพลังลมต่อนัยยะของการแพร่ละอองลอยอนุมานได้ว่า ในแต่ละสัทบริบท พยัญชนะก้กไม่ก้องพ่นลมจะมีแนวโน้มของอัตราการแพร่ละอองลอยมากที่สุด เนื่องจากมีระดับความก้องเพิ่มขึ้นในระดับเดียวกับพยัญชนะกักก้องและมีความชันของค่าความเข้มพลังลมในระดับสูง รองลงมาคือพยัญชนะกักไม่ก้องไม่พ่นลม และน้อยสุดคือพยัญชนะกักก้อง ข้อค้นพบในครั้งนี้แสดงให้เห็นปัจจัยของสัทสมบัติและสัทบริบทที่มีผลต่อการแปรของค่าทางกลสัทศาสตร์ของพยัญชนะกัก นอกจากนี้ การไล่ระดับแนวโน้มของอัตราการแพร่ละอองลอยช่วยชี้ให้เห็นความน่าจะเป็นของการแพร่เชื้อโรคที่อาจเกิดขึ้นเฉพาะในบริบทภาษาไทย


ความสัมพันธ์ระหว่างโครงสร้างสัทสัมพันธ์ของคำประสมภาษาไทยกับการกลายเป็นศัพท์, ลีนา มะลูลีม Jan 2022

ความสัมพันธ์ระหว่างโครงสร้างสัทสัมพันธ์ของคำประสมภาษาไทยกับการกลายเป็นศัพท์, ลีนา มะลูลีม

Chulalongkorn University Theses and Dissertations (Chula ETD)

วิทยานิพนธ์นี้มีวัตถุประสงค์เพื่อวิเคราะห์ความสัมพันธ์ระหว่างโครงสร้างสัทสัมพันธ์กับระดับการกลายเป็นศัพท์ของคำประสมภาษาไทย งานวิจัยเก็บข้อมูลจากอัตราส่วนค่าระยะเวลาพยางค์ซึ่งเป็นค่าทางกลสัทศาสตร์ที่บ่งชี้การเน้นคำและโครงสร้างสัทสัมพันธ์ระดับคำของคำประสมภาษาไทย ร่วมกับค่าบ่งชี้การกลายเป็นศัพท์ในเชิงปริมาณ ซึ่งแสดงถึงระดับการเปลี่ยนแปลงในแง่มุมต่าง ๆ ของกระบวนการกลายเป็นศัพท์ทั้งสิ้นสามค่า ได้แก่ 1) ระดับความหมายเชิงประกอบซึ่งบ่งชี้ระดับการเปลี่ยนแปลงความหมาย เก็บข้อมูลจากการทดลองตัดสินคำศัพท์ 2) ค่าระยะเวลาตอบสนองซึ่งบ่งชี้ระดับการเปลี่ยนแปลงหน่วยคำวากยสัมพันธ์ เก็บข้อมูลจากการตัดสินของผู้พูดโดยใช้แบบสอบถามระดับความหมายเชิงประกอบ และ 3) ความถี่การปรากฏซึ่งบ่งชี้ระดับการเปลี่ยนแปลงในเชิงการใช้ เก็บข้อมูลจากค่าความถี่ในคลังข้อมูล ผลการศึกษาพบว่าโครงสร้างสัทสัมพันธ์ของคำประสมสัมพันธ์กับระดับการกลายเป็นศัพท์ตามสมมติฐาน โดยคำประสมที่มีระดับการกลายเป็นศัพท์สูงนั้นมีลักษณะคล้ายคลึงกับคำเดี่ยวคือประกอบด้วยคำสัทสัมพันธ์หนึ่งคำและมีรูปแบบการเน้นแบบ เน้นรอง-เน้นหลัก ในขณะที่คำประสมที่มีระดับการกลายเป็นศัพท์ต่ำนั้นมีลักษณะคล้ายคลึงกับวลีสองพยางค์คือ ประกอบด้วยคำสัทสัมพันธ์สองคำ แสดงผ่านรูปแบบการเน้นแบบ เน้นหลัก-เน้นหลัก ข้อค้นพบของงานวิจัยนี้แสดงให้เห็นว่าเมื่อคำประสมผ่านกระบวนการกลายเป็นศัพท์ โครงสร้างสัทสัมพันธ์มีการเปลี่ยนแปลงจากโครงสร้างที่มีหลายคำสัทสัมพันธ์ควบรวมกลายเป็นคำสัทสัมพันธ์เดียว โดยมีการลดลงของอัตราส่วนค่าระยะเวลาควบคู่ไปกับการเปลี่ยนแปลงโครงสร้างทางสัทสัมพันธ์ด้วย


การเปรียบเทียบค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกักในเสียงพูดและเสียงร้องเพลงของภาษาไทย, สรชัช พนมชัยสว่าง Jan 2022

การเปรียบเทียบค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกักในเสียงพูดและเสียงร้องเพลงของภาษาไทย, สรชัช พนมชัยสว่าง

Chulalongkorn University Theses and Dissertations (Chula ETD)

ลักษณะที่แสดงความแตกต่างของเสียงพูดและเสียงร้องเพลงในทางกลสัทศาสตร์นั้นได้มีการศึกษาพบหลายลักษณะด้วยกัน หนึ่งในนั้นรวมถึงลักษณะที่ไม่เกี่ยวข้องกับส่วนที่เป็นเสียงก้อง เช่นค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกัก (Voice Onset Time) ซึ่งแสดงค่าระยะเวลาจากจุดเปิดฐานกรณ์จนถึงจุดที่เกิดการสั่นของเส้นเสียงของพยัญชนะกักในตำแหน่งต้นพยางค์ งานวิจัยที่ผ่านมาซึ่งศึกษาภาษาอังกฤษพบว่าเสียงร้องเพลงจะมีค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกักน้อยกว่าเสียงพูด ในงานวิจัยชิ้นนี้ซึ่งศึกษาในภาษาไทยซึ่งมีความแตกต่างในการเปรียบต่างทางสัทวิทยาของพยัญชนะกักนั้น ได้ศึกษาด้วยวิธีการที่มีต้นแบบจากงานที่ผ่านมาในภาษาอังกฤษ และวิเคราะห์ทางสถิติด้วย mixed-effect linear regression พบว่า ความแตกต่างของค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกักระหว่างเสียงพูดและเสียงร้องเพลงนั้น มีนัยสำคัญเพียงในพยัญชนะกักไม่ก้องพ่นลมเท่านั้น โดยมีแนวโน้มที่เสียงร้องเพลงจะมีค่าช่วงเวลาเริ่มเสียงก้องของพยัญชนะกักมากกว่าเสียงพูด ซึ่งต่างกับในงานวิจัยในภาษาอังกฤษ นำมาสู่ข้อสรุปว่าความแตกต่างของเสียงพูดและเสียงร้องเพลงในภาษาไทยนั้นอาจมีการพ่นลมเป็นหนึ่งในปัจจัยสำคัญ ซึ่งน่าจะเกิดจากการเน้นพยัญชนะให้ชัดเจนในขณะร้องเพลง


Resolving Thai Zero Pronoun Using Masked Language Model, Sumana Sumanakul Jan 2022

Resolving Thai Zero Pronoun Using Masked Language Model, Sumana Sumanakul

Chulalongkorn University Theses and Dissertations (Chula ETD)

Zero pronoun resolution is an actively challenging NLP task in Thai. However, only a few previous studies have focused on this topic. Therefore, we explore a modern approach that could outperform existing state-of-the-art methods on various datasets and downstream tasks, the transformer-based, pre-trained language model, to apply to the Thai zero pronoun resolution task. We conduct two experiments on a small corpus, which are (1) using a pre-trained masked language model to predict zero pronominal expressions and (2) fine-tuning Wangchanberta on a token classification task to classify persons of pronouns. Based on our experiments, the results demonstrate the effectiveness of …


Thai Sentence Segmentation Using Large Language Models, Narongkorn Panitsrisit Jan 2022

Thai Sentence Segmentation Using Large Language Models, Narongkorn Panitsrisit

Chulalongkorn University Theses and Dissertations (Chula ETD)

Thai sentence segmentation has been on the topic of interest among Thai NLP communities. However, not much literature has explored the use of transformer-based large language models to tackle the issue. We conduct three experiments on the LST20 corpus, including (1) fine-tuning WangchanBERTa, a large language model pre-trained on Thai, across different classification tasks, (2) joint learning for clause and sentence segmentation, and (3) cross-lingual transfer using the multilingual model XLM-RoBERTa. Our findings show that WangchanBERTa outperforms other models in Thai sentence segmentation, and fine-tuning it with token and contextual information further improves its performance. However, cross-lingual transfer from English …