การสืบค้นสารสนเทศ

Posted: มิถุนายน 28, 2011 in บริการสารสนเทศ (Information Service)

ปัจจุบันมีข้อมูลจำนวนมากเผยแพร่อยู่ในอินเทอร์เน็ต  มีทั้งข้อมูลเชิงสารคดีและบันเทิงคดี เช่น การรายงานข่าวประจำวัน  ข้อมูลอันดับหนัง อันดับเพลงฮิต  สถานที่ท่องเที่ยวที่น่าสนใจ วารสารอิเล็กทรอนิกส์ที่ให้บริการบนเว็บ การประกาศโฆษณาขายของบนอินเทอร์เน็ต  ซึ่งมีการคาดการณ์กันว่ามีจำนวนเว็บไซต์เกิดใหม่ในแต่ละวันมีจำนวนเป็นล้านเว็บไซต์ต่อวัน  

  • การค้นหาข้อมูลที่ต้องการบนอินเทอร์เน็ต จึงเป็นเรื่องที่ค่อนข้างยุ่งยาก 
  • ดังนั้น ผู้ใช้งานอินเทอร์เน็ตจึงควรมีความรู้เกี่ยวกับเทคนิคการค้นหาข้อมูลบนอินเทอร์เน็ตอย่างคร่าวๆ
  • โดยใช้บริการจากเว็บไซต์ที่ให้บริการเครื่องมือช่วยค้นหาข้อมูลบนอินเทอร์เน็ต
  • เครื่องมือช่วยค้นหาข้อมูลบนอินเทอร์เน็ตมี 5 ประเภทใหญ่ๆ คือ (Bradley, 2002)
  •  
    • 1.       Free text Search Engines
    • 2.      Directory Search Engines
    • 3.      Meta Search Engines
    • 4.       Natural-language Search Engines
    • 5.       Resource or Site-specific Search Engines

ข้อพึงตระหนัก

  • สารสนเทศหรือข้อมูลที่สืบค้นได้จากเว็บที่ให้บริการสืบค้นสารสนเทศ มีวิธีการจัดทำ 2 แบบหลักๆ คือ
    • โดยโปรแกรมคอมพิวเตอร์เป็นผู้จัดทำ (Crawler-based search engines) และ
    • โดยมนุษย์เป็นผู้จัดทำ (Human-powered directories)

     

  • ผลการสืบค้นที่ได้คือข้อมูลที่มาจากฐานข้อมูลของเว็บไซต์ที่ให้บริการ  ไม่ใช่ข้อมูลปัจจุบันจากเว็บต่างๆ แบบ Online (เว็บไซต์จริงอาจมีการเปลี่ยนแปลงข้อมูล)  
  • โดย Search Engine จะทำการสำรวจเอกสารเว็บแล้วนำมารวบรวมไว้ในฐานข้อมูลของตน      
  • ดังนั้น ผลการค้นที่ได้จากแต่ละเว็บไซต์ที่บริการย่อมจะต่างกันด้วย  ขึ้นอยู่กับ
    • ขนาดของฐานข้อมูล  (พื้นที่ฮาร์ดดิสก์)
    • ความถี่ในการปรับปรุงข้อมูล 
    • ความสามารถของโปรแกรมการค้น  
    • การกำหนดดรรชนีและการจัดกลุ่มข้อมูล

     

  • จึงควรสืบค้นสารสนเทศมากกว่าหนึ่งเว็บไซต์  และมากกว่าหนึ่งช่วงเวลา

วิธีการทำงานของ Search Engine

โดยทั่วไปเว็บไซต์ Search engines มีกระบวนการทำงาน (Sullivan, 2001) แบ่งออกเป็น 3 ขั้นตอน คือ

  • ใช้โปรแกรมรวบรวมเอกสารเว็บ (spider หรือ  crawler) สำรวจและอ่านหน้าเว็บจากโดเมนต่างๆ  และหากพบ links ก็จะทำการติดตาม links ภายใน site จนครบ ซึ่งจากการทำงานในลักษณะโยงใยนี้ จึงเป็นที่มาของคำว่า spider หรือ crawler จากนั้น spider จะนำข้อมูลเว็บดังกล่าวไปเก็บไว้ในฐานข้อมูลของ Search Engine และ spider จะกลับไปตรวจสอบข้อมูลในเว็บนั้น ๆ อย่างสม่ำเสมอ เช่น ทุก 1 หรือ 2 เดือน เพื่อสำรวจความเปลี่ยนแปลง
  • จัดทำรายการดรรชนี 
    • ข้อมูลที่โปรแกรม spider พบจะถูกทำสำเนาและส่งมาจัดเก็บที่รายการดรรชนี (index  หรือ catalog) ตามบัญชีดรรชนีที่ (มนุษย์) กำหนดไว้
    • หากข้อมูลที่เว็บต้นฉบับมีการเปลี่ยนแปลงข้อมูลในสมุดดรรชนีจะเปลี่ยนแปลงด้วย  

     

  • โปรแกรมสืบค้น (Search engine software)
    • จะเป็นโปรแกรมส่วนที่ผู้ใช้อินเทอร์เน็ตติดต่อเข้าใช้บริการ
    • จะทำหน้าที่ในการค้นคืนข้อมูลจากฐานข้อมูลของ search engine
    • จะเริ่มต้นการทำงานเมื่อผู้ใช้ป้อนคำค้น
      • โปรแกรมจะนำคำค้นของผู้ใช้ไปจับคู่กับดรรชนีในฐานข้อมูล
      • แล้วทำการดึงข้อมูล (เอกสารเว็บ) ที่ตรงกับคำค้นออกมา
      • และจัดลำดับผลการค้นตามระดับความเกี่ยวข้องที่โปรแกรมประเมินได้  

       

    • Search engine แต่ละตัวจะใช้ตรรกะที่แตกต่างกันไป
    • ตัวอย่างการสร้างเกณฑ์ในการกำหนดค่าน้ำหนักให้กับคำดรรชนีของ Search engine อาจจัดลำดับ  ดังนี้ (Bradley, 2002) 
      • 1. จะให้ค่าน้ำหนักความเกี่ยวข้องกับคำค้นมากที่สุด (ตามที่มนุษย์ได้ตั้งค่าโปรแกรมไว้)
      • 2. คำ หรือวลี ที่ปรากฏใน Meta tag elements (เป็นส่วนหนึ่งของการเขียนเอกสาร html)
      • 3. คำ หรือวลี ที่ปรากฏใน Title tag (ปรากฏที่บรรทัดแรกของ Title bar)
      • 4. คำ หรือวลี ที่ปรากฏใน Main heading และ Sub heading (ข้อความที่เป็นขนาดใหญ่  ขนาดรอง ในแต่ละ Web page)
      • 5. จำนวนครั้งที่ คำ หรือวลี ปรากฏในส่วนเนื้อหาของเอกสาร
      • 6. ความถี่ที่เว็บอื่นๆ เชื่อมโยงเข้ามา (มีการตรวจสอบโดยใช้โปรแกรม)
 การสืบค้นสารนิเทศด้วยระบบคอมพิวเตอร์
คอมพิวเตอร์เข้ามามีบทบาทในทุกวงการ และในปัจจุบันนิยมนำมาใช้ในการค้นหาความรู้ข้อมูล ข่าวสารจากแหล่งสารนิเทศที่มีอยู่อย่างมากมาย ทำให้การค้นหาเป็นไปอย่างสะดวกและรวดเร็วการสืบค้นสารสนเทศจากเว็บโอแพค
ในอดีตเครื่องมือที่ช่วยค้นที่ห้องสมุดทั่วไปนิยมใช้ คือ บัตรรายการ ปัจจุบันมีการประยุกต์ใช้เทคโนโลยีสารสรเทศให้บัตรรายการอยู่ในหน้าจอคอมพิวเตอร์และสามารถสืบค้นหาวัสดุในเรื่องที่ต้องการได้อย่างสะดวก รวดเร็ว ทั้งยังค้นในเวลาเดียวกันได้ทีละหลายคน โปรแกรมจัดเก็บและค้นคืนจากหน้าจอคอมพิวเตอร์นี้เรียกว่า “ระเบียนสาธารณะที่เข้าถึงได้ทางออนไลน์”หรือเรียกสั้นๆว่า โอแพค
โอแพค (OPAC) มาจากคำเต็มว่า Online Public Access Catalogเป็นรายการทรัพยากรสารนิเทศในห้องสมุดที่บันทึกอยู่ในรูปแบบที่อ่านได้ด้วยเครื่องคอมพิวเตอร์ (MARC : Machine Readable Catalog) หรืออาจเรียกได้ว่าเป็นบัตรรายการที่อยู่ในรูปแบบอิเล็กทรอนิกส์ ทั้งสิ่งพิมพ์ภาษาไทยและภาษาต่างประเทศ ซีดีรอม ฯลฯ ที่มีให้บริการในห้องสมุด โดยมีระบบการจัดการฐานข้อมูล ช่วยผู้ใช้ให้สามารถค้นหาทรัพยากรได้ง่าย รวดเร็วและตรงตามความต้องการมากขึ้น ซึ่งจะมีรายละเอียดการค้นเช่นเดียวกับการค้นจากบัตรรายการ การค้นเมนูชื่อผู้แต่ง ชื่อเรื่อง หัวเรื่อง ค้นด้วยคำสำคัญเดียวกันอาจได้สารนิเทศเกือบทุกประเภทที่เกี่ยวข้องกับคำสำคัญนั้น ๆ OPAC เป็นระบบค้นหารายการหนังสือในห้องสมุดโดยใช้ระบบคอมพิวเตอร์ เริ่มมีใช้ในช่วงกลางคริสต์ทศวรรษที่ 1990 แทนที่ระบบแบบเก่าที่เป็นบัตรกระดาษทำให้ไม่ต้องใช้บัตรรายการค้นหาทรัพยากรสารนิเทศทีละประเภทเหมือนแต่ก่อนในปัจจุบันผู้ใช้บริการห้องสมุดหรือบรรณารักษ์ สามารถสืบค้นผ่านคอมพิวเตอร์ในห้องสมุด หรือว่าใช้คอมพิวเตอร์ผ่านทางเครือข่ายคอมพิวเตอร์ต่างๆ เช่น สามารถค้นจากที่บ้าน ที่ทำงาน หรือที่ใด ๆ ในโลกที่เชื่อมต่อกับระบบ Internet ได้ ก็สามารถเข้าถึงบริการดังกล่าวไป ผู้ค้นไม่ต้องเสียเวลาเดินทางไปตรวจสอบถึงห้องสมุด และยังสามารถเข้าใช้บริการ OPAC ของห้องสมุดอื่นๆได้ ไม่จำกัดเวลาและสถานที่ โดยไม่ต้องเป็นสมาชิกระบบโอแพค (OPAC)ใช้ประโยชน์ในการค้นคืนสารสนเทศในห้องสมุดได้อย่างไร
1.ใช้สำหรับค้นหาข้อมูลทางบรรณานุกรมของทรัพยากรสารสนเทศที่ห้องสมุดได้อย่างสะดวก และรวดเร็ว โดยสืบค้นจากคอมพิวเตอร์แทนบัตรรายการ
2. นอกจากใช้สำหรับค้นหาข้อมูลทางบรรณานุกรมของทรัพยากรสารสนเทศแล้วยังสามารถใช้ในการตรวจสอบข้อมูลการยืมของตนเองได้อีกด้วย
3. ค้นหาบทความจากวารสารที่มีให้บริการในห้องสมุด

ทำไมต้องสืบค้น OPAC
– เพื่อทราบว่าห้องสมุดมีทรัพยากรสารสนเทศที่ต้องการหรือไม่
– เพื่อทราบรายละเอียดต่างๆ เกี่ยวกับข้อมูลทางบรรณานุกรมของทรัพยากรสารสนเทศก่อนตัดสินใจคัดเลือกทรัพยากรสารสนเทศที่ต้องการ
– เพื่อทราบเลขเรียกหนังสือ สถานที่จัดเก็บ และสถานภาพของทรัพยากรสารสนเทศก่อนที่จะไปหาตัวเล่มบนชั้น
– เพื่อใช้บริการอัตโนมัติต่างๆ ที่เกี่ยวกับการใช้ทรัพยากรสารสนเทศของห้องสมุดได้แก่ การจอง การยืมต่ออัตโนมัติ การตรวจสอบข้อมูลการยืม และการรวบรวมรายการบรรณานุกรม

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s