โลโก้
ยูเนี่ยนพีเดีย
การสื่อสาร
ดาวน์โหลดได้จาก Google Play
ใหม่! ดาวน์โหลด ยูเนี่ยนพีเดีย บน Android ™ของคุณ!
ฟรี
เร็วกว่าเบราว์เซอร์!
 

คลังข้อความ

ดัชนี คลังข้อความ

ในภาษาศาสตร์ คลังข้อความ (text corpus) คือข้อความปริมาณมากที่ได้จัดเก็บตามลำดับโครงสร้าง (ปัจจุบันนี้มักจะจัดเก็บและประมวลผลในรูปแบบอิเล็กทรอนิกส์) คลังข้อความสามารถจัดเก็บข้อความของภาษาเดียว (คลังข้อความภาษาเดียว) หรือจัดเก็บข้อความหลายภาษา (คลังข้อความหลายภาษา) คลังข้อความหลายภาษามักจะจัดอยู่ในรูปแบบพิเศษ สามารถมองเห็นส่วนของข้อความที่มีความหมายตรงกันได้ คลังข้อความชนิดนี้เรียกว่า "คล้งข้อความขนานระบุส่วนตรงกัน" ดังตัวอย่างด้านล่าง เพื่อที่จะทำให้คลังข้อความมีประโยชน์ยิ่งขึ้นสำหรับการวิจัยทางภาษาศาสตร์ จึงมักมี "การกำกับ" ข้อมูลทางภาษาศาสตร์เพิ่มเติมลงในคลังข้อความ ตัวอย่างเช่น การกำกับชนิดของคำ ในการกำกับชนิดของคำทุกคำในคลังข้อความจะมีข้อมูลเพิ่มว่าเป็นคำชนิดใด เช่น นาม กริยา วิเศษณ์ หรืออื่นๆ โดยแทรกเข้าในคลังข้อความในรูปแบบข้อความธรรมดา ตัวอย่างอื่นๆ เช่น การกำกับข้อมูลวายกสัมพันธ์ลงในคลังข้อความอย่างเช่นที่ทำในคลังต้นไม้.

8 ความสัมพันธ์: ภาษาภาษาศาสตร์อิเล็กทรอนิกส์ข้อความธรรมดาคลังข้อความขนานคลังต้นไม้คำกริยาคำนาม

ภาษา

ษาในความหมายอย่างกว้าง หมายถึง การพูดอะไรก็ได้ที่เป็นภาษาเช่น สวัสดี คน สวย ให้ พี่ ไป ส่ง ป่าว เป็นราก...

ใหม่!!: คลังข้อความและภาษา · ดูเพิ่มเติม »

ภาษาศาสตร์

ษาศาสตร์ (linguistics) คือ การศึกษาเกี่ยวกับภาษามนุษย์ ผู้ที่ศึกษาในด้านนี้เรียกว่า นักภาษาศาสตร.

ใหม่!!: คลังข้อความและภาษาศาสตร์ · ดูเพิ่มเติม »

อิเล็กทรอนิกส์

อิเล็กทรอนิกส์ (Electronics) เป็นเทคโนโลยีที่เกี่ยวข้องกับวงจรไฟฟ้าที่ประกอบด้วยอุปกรณ์ไฟฟ้าที่เป็น active component เช่นหลอดสูญญากาศ, ทรานซิสเตอร์, ไดโอด และ Integrated Circuit และ ชิ้นส่วน พาสซีฟ (passive component) เช่น ตัวนำไฟฟ้า, ตัวต้านทานไฟฟ้า, ตัวเก็บประจุ และคอยล์ พฤติกรรมไม่เชิงเส้นของ active component และความสามารถในการควบคุมการไหลของอิเล็กตรอนทำให้สามารถขยายสัญญาณอ่อนๆให้แรงขึ้นเพื่อการสื่อสารทางภาพและเสียงเช่นโทรเลข, โทรศัพท์, วิทยุ, โทรทัศน์ เป็นต้น อิเล็กทรอนิกส์ถูกใช้กันอย่างแพร่หลายในการสื่อสารข้อมูลโทรคมนาคม ความสามารถของอุปกรณ์อิเล็กทรอนิกส์ที่ทำหน้าที่เป็นสวิทช์ปิดเปิดวงจรถูกนำไปใช้ในวงจร ลอจิกเกต ซึ่งเป็นส่วนสำคัญหลักในระบบคอมพิวเตอร์ นอกจากนั้น วงจรอิเล็กทรอนิกส์ยังถูกนำไปใช้ผลิตเครื่องใช้ไฟฟ้าในครัวเรือน ในการส่งพลังงานไฟฟ้าเป็นระยะทางไกลๆ การผลิตพลังงานทดแทน และอุตสาหกรรมต่างๆอีกมาก อิเล็กทรอนิกส์แตกต่างจากวิทยาศาสตร์ไฟฟ้าและเทคโนโลยีเครื่องกลไฟฟ้า โดยจะเกี่ยวข้องกับการสร้าง, การกระจาย, การสวิทช์, การจัดเก็บและการแปลงพลังงานไฟฟ้าไปและมาจากพลังงานรูปแบบอื่น ๆ โดยใช้สายไฟ, มอเตอร์, เครื่องกำเนิดไฟฟ้า, แบตเตอรี่, สวิตช์, รีเลย์, หม้อแปลงไฟฟ้า ตัวต้านทานและส่วนประกอบที่เป็นพาสซีพอื่นๆ ความแตกต่างนี้เริ่มราวปี 1906 เป็นผลจากการประดิษฐ์ไตรโอดโดยลี เดอ ฟอเรสท์ ซึ่งใช้ขยายสัญญาณวิทยุที่อ่อนๆได้ ทำให้เกิดการออกแบบและพัฒนาระบบการรับส่งสัญญาณเสียงและหลอดสูญญากาศ จึงเรียกสาขานี้ว่า "เทคโนโลยีวิทยุ" จนถึงปี 1950 ปัจจุบัน อุปกรณ์อิเล็กทรอนิกส์ส่วนใหญ่ ใช้ชิ้นส่วนสารกึ่งตัวนำเพื่อควบคุมการทำงานของอิเล็กตรอน การศึกษาเกี่ยวกับอุปกรณ์สารกึ่งตัวนำและเทคโนโลยีโซลิดสเตต ในขณะที่การออกแบบและการสร้างวงจรอิเล็กทรอนิกส์ในการแก้ปัญหาในทางปฏิบัติอยู่ภายใต้สาขาวิศวกรรมอิเล็กทรอนิกส์ บทความนี้มุ่งเน้นด้านวิศวกรรมของ.

ใหม่!!: คลังข้อความและอิเล็กทรอนิกส์ · ดูเพิ่มเติม »

ข้อความธรรมดา

ตัวอย่างข้อความธรรมดา ข้อความธรรมดา หรือ เพลนเท็กซ์ (plain text) ในวิทยาการคอมพิวเตอร์ หมายถึง ข้อความปกติทั่วไปที่ไม่มีการจัดรูปแบบใด ๆ เช่น "ข้อความตัวหนาและตัวเอียง ในลักษณะนี้เรียกว่าข้อความธรรมดา" ส่วนข้อความต่อไปนี้เรียกว่า ข้อความจัดรูปแบบ เช่น "ข้อความตัวหนาและตัวเอียง ในลักษณะนี้ไม่เรียกว่าข้อความธรรมดา" ข้อความธรรมดาในทางคอมพิวเตอร์สามารถหมายถึง ไฟล์ที่มีเนื้อหาเป็นข้อความที่ไม่ได้จัดรูปแบบใด ๆ เป็นข้อมูลที่มนุษย์สามารถอ่านออก ซึ่งข้อมูลที่ถูกจัดเก็บในไฟล์จะอยู่รูปของรหัสแอสกีหรือรหัสข้อความอื่น ๆ ข้อความธรรมดายังหมายถึงไฟล์ข้อมูลที่สามารถใช้โปรแกรมแก้ไขข้อความทั่ว ๆ ไป เช่น Notepad (สำหรับ ไมโครซอฟท์ วินโดวส์), edlin (สำหรับ ไมโครซอฟท์ ดอส), ed, vi, Emacs, pico, nano (สำหรับ ยูนิกซ์, ลีนุกซ์), SimpleText (สำหรับ แมคโอเอส) เป็นต้น ในการแก้ไขข้อมูลไม่ว่าจะเป็นการพิมพ์เพิ่มตัวอักษร ลบตัวอักษร หรือแก้ไขตัวอักษร และทำการจัดเก็บไฟล์นั้นได้ หมวดหมู่:รูปแบบไฟล์คอมพิวเตอร์.

ใหม่!!: คลังข้อความและข้อความธรรมดา · ดูเพิ่มเติม »

คลังข้อความขนาน

ลังข้อความขนาน (Parallel text) คือ ข้อความต้นฉบับและข้อความภาษาอื่นๆ ที่แปลมาจากข้อความต้นฉบับ ในคลังข้อความขนานระบุส่วนตรงกัน มีการระบุประโยคที่ตรงกันของคู่ข้อความที่ต่างภาษา ดังตัวอย่างในตารางด้านล่าง การระบุประโยคที่ตรงกันในคลังข้อความขนาน มีความสำคัญในการศึกษาวิจัยในหลายสาขาย่อยของภาษาศาสตร์ ในการแปลภาษา ประโยคหลายประโยคสามารถแปลรวมกันเป็นประโยคเดียว หรือไม่แปลบางประโยค หรือเพิ่มประโยคใหม่ที่ไม่มีในข้อความต้นฉบับ หรือเปลี่ยนลำดับของประโยคในเอกสารแปลและเอกสารต้นฉบับให้ไม่ตรงกัน ด้วยสาเหตุข้างต้นการระบุประโยคที่ตรงกันในคลังข้อความขนานจึงไม่ใช่เรื่องตรงไปตรงมา ในการแปลภาษาด้วยเครื่อง (machine translation) คลังข้อความขนานมีประโยชน์อย่างมาก เมื่อใช้ร่วมกับการเรียนรู้ของเครื่อง โดยให้เครื่องเรียนการแปลจากประโยคตัวอย่าง.

ใหม่!!: คลังข้อความและคลังข้อความขนาน · ดูเพิ่มเติม »

คลังต้นไม้

ลังต้นไม้ (treebank) คือคลังข้อความที่ในแต่ละประโยคได้กำกับโครงสร้างวากยสัมพันธ์ โครงสร้างวากยสัมพันธ์มักจะแทนด้วยโครงสร้างต้นไม้ ซึ่งเป็นที่มาของคำว่าคลังต้น คลังต้นไม้สามารถใช้ในการศึกษาปรากฏการณ์ทางวากยสัมพันธ์ในภาษาศาสตร์เชิงคำนวณ หรือใช้ฝึกสอนและทดสอบโปรแกรมแจงประโยค คลังต้นไม้มักจะสร้างบนคลังประโยคที่ได้กำกับชนิดของคำไว้แล้ว ในลักษณะเดียวกันคลังต้นไม้ก็สามารถใช้เป็นฐานในการกำกับข้อมูลทางความหมายหรือข้อมูลทางภาษาศาสตร์อื่นๆ คลังต้นไม้สามารถสร้างนักภาษาศาสตร์โดยไม่ใช้เครื่องช่วยกำกับ หรืออาจจะสร้างแบบกึ่งอัตโนมัติโดยใช้โปรแกรมแจงประโยคช่วยกำกับและนักภาษาศาสตร์จึงทำการตรวจสอบและแก้ไขผลที่ได้จากการแจงประโยคก็ได้ คลังต้นไม้สามารถสร้างโดยมีพื้นฐานบนทฤษฎีที่แตกต่างกัน เช่น (ใช้ทฤษฎี HPSG) แต่ส่วนมากแล้วการสร้างคลังต้นไม้มักจะพยายามให้ขึ้นอยู่กับทฤษฎีน้อยที่สุด (ใช้ได้กับหลายๆ ทฤษฎี) อย่างไรก็ตามคลังต้นไม้ก็ถูกแบ่งออกเป็น 2 กลุ่มใหญ่ๆ ได้แก่คลังต้นไม้แบบโครงสร้างวลี (ตัวอย่างเช่น) และ คลังต้นไม้แบบโครงสร้างดีเพนเดนซี (ตัวอย่างเช่น). โครงสร้างวากยสัมพันธ์ในคลังต้นไม้สามารถแทนได้หลายรูปแบบ ยกตัวอย่างเช่น การครอบวงเล็บอย่างง่ายบนไฟล์ข้อความ ดังเช่นในตัวอย่างต่อไปนี้ของ.

ใหม่!!: คลังข้อความและคลังต้นไม้ · ดูเพิ่มเติม »

คำกริยา

ำกริยา คือคำที่ใช้บ่งบอกถึงการกระทำ การปรากฏ หรือสถานะของสิ่งที่กล่าวถึง คำกริยาอาจมีรูปแบบที่แตกต่างกันขึ้นอยู่กับภาษา อันมีองค์ประกอบจากกาล การณ์ลักษณะ มาลา วาจก หรือรวมทั้งบุรุษ เพศ และพจน์ของสิ่งที่กล่าวถึงด้ว.

ใหม่!!: คลังข้อความและคำกริยา · ดูเพิ่มเติม »

คำนาม

ำนาม คือคำที่ทำหน้าที่เป็นชื่อของสิ่งของใด ๆ หรือชุดของสิ่งของใด ๆ เช่น สิ่งมีชีวิต วัตถุ สถานที่ การกระทำ คุณสมบัติ สถานะ หรือแนวคิด ในทางภาษาศาสตร์ คำนามเป็นหนึ่งในวจีวิภาคแบบเปิดที่สมาชิกสามารถเป็นคำหลักในประธานของอนุประโยค กรรมของกริยา หรือกรรมของบุพบท หมวดหมู่คำศัพท์ (วจีวิภาค) ถูกนิยามในทางที่ว่าสมาชิกจะอยู่รวมกับนิพจน์ชนิดอื่น ๆ กฎทางวากยสัมพันธ์ของคำนามจะแตกต่างกันระหว่างภาษาต่าง ๆ ในภาษาอังกฤษ คำนามคือคำที่สามารถมาพร้อมกับคำนำหน้านาม (article) และคำคุณศัพท์กำหนดลักษณะ (attributive adjective) และสามารถทำหน้าที่เป็นคำหลัก (head) ของนามวลี.

ใหม่!!: คลังข้อความและคำนาม · ดูเพิ่มเติม »

ขาออกขาเข้า
Hey! เราอยู่ใน Facebook ตอนนี้! »