โลโก้
ยูเนี่ยนพีเดีย
การสื่อสาร
ดาวน์โหลดได้จาก Google Play
ใหม่! ดาวน์โหลด ยูเนี่ยนพีเดีย บน Android ™ของคุณ!
ฟรี
เร็วกว่าเบราว์เซอร์!
 

คลังต้นไม้

ดัชนี คลังต้นไม้

ลังต้นไม้ (treebank) คือคลังข้อความที่ในแต่ละประโยคได้กำกับโครงสร้างวากยสัมพันธ์ โครงสร้างวากยสัมพันธ์มักจะแทนด้วยโครงสร้างต้นไม้ ซึ่งเป็นที่มาของคำว่าคลังต้น คลังต้นไม้สามารถใช้ในการศึกษาปรากฏการณ์ทางวากยสัมพันธ์ในภาษาศาสตร์เชิงคำนวณ หรือใช้ฝึกสอนและทดสอบโปรแกรมแจงประโยค คลังต้นไม้มักจะสร้างบนคลังประโยคที่ได้กำกับชนิดของคำไว้แล้ว ในลักษณะเดียวกันคลังต้นไม้ก็สามารถใช้เป็นฐานในการกำกับข้อมูลทางความหมายหรือข้อมูลทางภาษาศาสตร์อื่นๆ คลังต้นไม้สามารถสร้างนักภาษาศาสตร์โดยไม่ใช้เครื่องช่วยกำกับ หรืออาจจะสร้างแบบกึ่งอัตโนมัติโดยใช้โปรแกรมแจงประโยคช่วยกำกับและนักภาษาศาสตร์จึงทำการตรวจสอบและแก้ไขผลที่ได้จากการแจงประโยคก็ได้ คลังต้นไม้สามารถสร้างโดยมีพื้นฐานบนทฤษฎีที่แตกต่างกัน เช่น (ใช้ทฤษฎี HPSG) แต่ส่วนมากแล้วการสร้างคลังต้นไม้มักจะพยายามให้ขึ้นอยู่กับทฤษฎีน้อยที่สุด (ใช้ได้กับหลายๆ ทฤษฎี) อย่างไรก็ตามคลังต้นไม้ก็ถูกแบ่งออกเป็น 2 กลุ่มใหญ่ๆ ได้แก่คลังต้นไม้แบบโครงสร้างวลี (ตัวอย่างเช่น) และ คลังต้นไม้แบบโครงสร้างดีเพนเดนซี (ตัวอย่างเช่น). โครงสร้างวากยสัมพันธ์ในคลังต้นไม้สามารถแทนได้หลายรูปแบบ ยกตัวอย่างเช่น การครอบวงเล็บอย่างง่ายบนไฟล์ข้อความ ดังเช่นในตัวอย่างต่อไปนี้ของ.

5 ความสัมพันธ์: ภาษาศาสตร์วากยสัมพันธ์วจีวิภาคคลังข้อความประโยค

ภาษาศาสตร์

ษาศาสตร์ (linguistics) คือ การศึกษาเกี่ยวกับภาษามนุษย์ ผู้ที่ศึกษาในด้านนี้เรียกว่า นักภาษาศาสตร.

ใหม่!!: คลังต้นไม้และภาษาศาสตร์ · ดูเพิ่มเติม »

วากยสัมพันธ์

ในทางภาษาศาสตร์ วากยสัมพันธ์ (อังกฤษ: syntax) หมายถึง การศึกษาว่าด้วยกฎของความสัมพันธ์ของแบบแผนองค์ประกอบของประโยคในภาษา อันเป็นส่วนหนึ่งของหลักไวยกรณ์ของภาษา ในภาษาไทย "วากยสัมพันธ์" เป็นส่วนหนึ่งของหลักไวยกรณ์ไทยที่กำหนดขึ้นเป็นหนึ่งในแบบแผนหรือไวยกรณ์ของภาษาไทย ซึ่งประกอบด้วย 4 แบบแผนหลัก ได้แก่ อักขรวิธี ซึ่งศึกษาว่าด้วยอักษร, วจีวิภาค ศึกษาว่าด้วยคำ, วากยสัมพันธ์ ศึกษาว่าด้วยความสัมพันธ์ของคำในประโยค, และ ฉันทลักษณ์ คือ กฎเกณฑ์ของการเขียนภาษาในรูปแบบต่างๆ วากยสัมพันธ์ ยังเป็นชื่อตำราไวยากรณ์ไทยว่าด้วยประโยค และความเกี่ยวข้องของส่วนต่างๆ ในประโยค การศึกษากฎหรือความสัมพันธ์ของภาษาอย่างเป็นแบบแผน ที่ควบคุมการเรียงคำเป็นวลี และวลีเป็นปร.

ใหม่!!: คลังต้นไม้และวากยสัมพันธ์ · ดูเพิ่มเติม »

วจีวิภาค

วจีวิภาค (ละติน: pars orationis, part of speech) ในทางไวยากรณ์ หมายถึงประเภทของคำในทางภาษาศาสตร์ ซึ่งโดยทั่วไปนิยามโดยลักษณะวากยสัมพันธ์หรือหน่วยคำของคำที่กล่าวถึง แทบทุกภาษามีคำชนิดนามและกริยา แต่นอกเหนือจากนี้ จะมีแตกต่างกันไปในแต่ละภาษา ตัวอย่างเช่น ภาษาญี่ปุ่นมีคำคุณศัพท์สามชนิด ขณะที่ภาษาอังกฤษมีชนิดเดียว ภาษาจีน เกาหลีและญี่ปุ่นมีลักษณนาม ขณะที่ภาษาทางยุโรปไม่มี.

ใหม่!!: คลังต้นไม้และวจีวิภาค · ดูเพิ่มเติม »

คลังข้อความ

ในภาษาศาสตร์ คลังข้อความ (text corpus) คือข้อความปริมาณมากที่ได้จัดเก็บตามลำดับโครงสร้าง (ปัจจุบันนี้มักจะจัดเก็บและประมวลผลในรูปแบบอิเล็กทรอนิกส์) คลังข้อความสามารถจัดเก็บข้อความของภาษาเดียว (คลังข้อความภาษาเดียว) หรือจัดเก็บข้อความหลายภาษา (คลังข้อความหลายภาษา) คลังข้อความหลายภาษามักจะจัดอยู่ในรูปแบบพิเศษ สามารถมองเห็นส่วนของข้อความที่มีความหมายตรงกันได้ คลังข้อความชนิดนี้เรียกว่า "คล้งข้อความขนานระบุส่วนตรงกัน" ดังตัวอย่างด้านล่าง เพื่อที่จะทำให้คลังข้อความมีประโยชน์ยิ่งขึ้นสำหรับการวิจัยทางภาษาศาสตร์ จึงมักมี "การกำกับ" ข้อมูลทางภาษาศาสตร์เพิ่มเติมลงในคลังข้อความ ตัวอย่างเช่น การกำกับชนิดของคำ ในการกำกับชนิดของคำทุกคำในคลังข้อความจะมีข้อมูลเพิ่มว่าเป็นคำชนิดใด เช่น นาม กริยา วิเศษณ์ หรืออื่นๆ โดยแทรกเข้าในคลังข้อความในรูปแบบข้อความธรรมดา ตัวอย่างอื่นๆ เช่น การกำกับข้อมูลวายกสัมพันธ์ลงในคลังข้อความอย่างเช่นที่ทำในคลังต้นไม้.

ใหม่!!: คลังต้นไม้และคลังข้อความ · ดูเพิ่มเติม »

ประโยค

ประโยค อาจหมายถึง.

ใหม่!!: คลังต้นไม้และประโยค · ดูเพิ่มเติม »

เปลี่ยนเส้นทางที่นี่:

คลังต้นไม้ (ภาษาศาสตร์เชิงคำนวณ)

ขาออกขาเข้า
Hey! เราอยู่ใน Facebook ตอนนี้! »