Search Engine อันดับหนึ่งของโลกในเวลานี้ และเป็นอันดับหนึ่งในใจคนใช้งานอินเทอร์เน็ตนั่นก็คือ Google เพราะที่นี่เราสามารถหาได้ทุกอย่างตั้งแต่ไม้จิ้มฟันยันเรือรบ หลายๆ ท่านที่ใช้งานอาจจะสงสัยกันว่า ทำไม Google ถึงฉลาด ฉลาดคือสามารถเดาใจเราว่าจะพิมพ์อะไร, การเลือกเว็บไซต์ที่น่าจะตรงกับสิ่งที่เราหามากที่สุดมาจัดไว้เป็นอันดับต่างๆ และอื่นๆ อย่างมากเกี่ยวกับหน้าจอการค้นหาเหล่านี้ Google เลยจัดเตรียมคำตอบเหล่านี้ไว้บนหน้าเว็บที่ทำขึ้นมาเป็นพิเศษที่ชื่อว่า?How Search Works
How Search Works – From algorithms to answers?เป็นส่วนหนึ่งของหน้าเว็บพิเศษที่ชื่อว่า Inside Search ที่นำเสนอเรื่องราวต่างๆ เกี่ยวกับการค้นหาใน Google รวมถึงเทคนิคการใช้ต่างๆ ให้ได้ลองนำไปใช้และนำไปอ่านกัน และสำหรับส่วนของ?How Search Works นี้ทาง Google ตั้งใจที่จะบอกเล่าเรื่องราวเกี่ยวกับเบื้องหลังการค้นหาและการจัดอันดับการแสดงผลบนหน้าเว็บไซต์ ผ่านรูปแบบการนำเสนอข้อมูลแบบ interactive infographic โดยที่มีทั้งข้อมูล, ข้อความอธิบาย, รูปภาพ, วิดิโอ รวมทั้งการเชื่อมต่อกับหน้าเว็บอื่นๆ ของ Google ที่อธิบายหัวข้อนั้นๆ เพิ่มเติมถูกซ่อนอยู่ในรูปภาพเพื่อให้เราคลิกไปดูและอ่านได้เพิ่มเติม
Google แบ่งออกการเล่าออกเป็น 3 ส่วน ได้แก่ การหาเว็บและการทำให้หาได้ง่ายๆ, การสร้างอัลกอริทึ่มเพื่อแสดงข้อมูล และการจัดการแสปมและขยะทั้งหลาย
ส่วนแรกทาง Google เรียกว่า Crawling and Indexing ซึ่งก็หมายถึงการกวาดหน้าเว็บไซต์ทั้งหมดที่มีอยู่ในโลก (Google ใช้คำว่า Crawling เปรียบกับการซอกซอนเข้าทุกซอกของเว็บ) ซึ่ง Google อ้างอิงตัวเลขอยู่ที่ 30 ล้านล้านหน้าเว็บไซต์ด้วยวิธีการเปิดหน้าแต่ละหน้าของเว็บไซต์นั้นๆ จนหมด นอกจากนั้นแล้วการเข้าไปดูในหน้านั้นๆ ยังมีการอ่านเนื้อหาที่มีอยู่ในหน้านั้นด้วย โดยจะมีการจัดหมวดหมู่ต่างๆ ตามหมวดหมู่ต่างๆ ที่จะสามารถทำการค้นหาได้ โดยเรียกการทำนี้ว่า Indexing ซึ่งจะแทนด้วยกล่องต่างๆ ซึ่งใช้พื้นที่ในการเก็บ Index นี้มากกว่า 100 ล้าน gigabytes
หลังจากนั้นก็จะมาถึงส่วนที่สองคือ Algorithms ซึ่งถ้าใครคุ้นเคยกับการใช้งานไม่ว่าจะเป็นการเดาคำการค้นหา (Autocomplete), การสะกดที่แม้เราสะกดผิด Google ก็จะเดาว่าเราต้องการจะหาคำนี้มากกว่าหรือเปล่า (Spelling) หรือการหาด้วยการใช้เสียงและรูปภาพ ตรงนี้คือส่วนที่จะจัดการให้เพื่อที่จะทำให้ Google เข้าใจสิ่งที่คุณอยากค้นหามากที่สุด ก่อนที่จะไปทำการเทียบกับสิ่งที่ Google เก็บ index ที่อยู่ในกล่อง จากนั้นก็เริ่มเรียงลำดับการแสดงผล ซึ่งจะใช้ค่าต่างๆ คิดคำนวนเพื่อให้ได้ผลออกมา ไม่ว่าจะเป็นความสดใหม่ของข้อมูล, คุณภาพของหน้าจอและการแสดงผล, การใช้ภาษาบนเว็บ เป็นต้น จนสุดท้ายได้เป็นผลลัพธ์มาแสดงบนหน้าจอ ไม่ว่าจะเป็นบนหน้าเว็บเบราวเซอร์, สมาร์ทโฟนและแท็บเล็ต โดยกระบวนการทั้งหมดใช้เวลาเพียง 0.125 วินาที หรือ 1/8 วินาที
ส่วนสุดท้ายจะเป็นการเก็บกวาดหน้าเว็บขยะ หรือเรียกว่า Fighting Spam ซึ่งถ้าสังเกตให้ดีแล้ว เราจะไม่เคยได้เห็นผลลัพธ์ที่มีหน้าเว็บไซต์ที่มีข้อความรบกวน(Spam) หรือ ทั้งนี้ก็เพราะทาง Google เองได้มีการจัดการหน้าเว็บไซต์เหล่านี้ ทั้งหมดทำโดยทาง Google โดยไม่มีระบบอัตโนมัติ แต่ปัจจุบันนี้มี algorithm ที่ช่วยให้คนที่ค้นหาสิ่งที่ต้องการไม่สามารถเห็นผลการค้นหาจากเว็บประเภทนี้ ด้วยการจัดอันดับให้อยู่ท้ายๆ ไป โดยชื่อว่า Penguin และทาง Google จะทำการส่งเมลไปแจ้งเจ้าของเว็บไซต์ให้ทำการแก้ไข ในกรณีที่มีข้อผิดพลาดและสามารถแจ้งกลับทาง Google ได้หาทำการแก้ไขเสร็จเรียบร้อยแล้วได้
ทั้งหมดนี้คือสิ่งที่ทาง Google เตรียมไว้เพื่ออธิบายขั้นตอนทุกอย่างตั้งแต่การหาหน้าเว็บ จนกระทั่งส่งผลการค้นหาให้กับคนที่ต้องการได้อย่างตรงใจมากที่สุดและเร็วที่สุด ผมถือว่าเป็นสิ่งที่น่าสนใจและทำออกมาให้เข้าใจได้ง่ายขึ้นอย่างมาก ลองเข้าไปดูได้ครับที่ How Search Works
แถม…หากเปิดหน้าจอจนถึงด้านล่างสุดแล้ว จะเห็นระยะเวลาทั้งหมดที่เราเปิดหน้าเว็บอยู่ รวมทั้งจำนวนการค้นหาที่เกิดขึ้นบน Google ด้วยครับ ลองดูกันนะครับ
ที่มา: blog?insidesearch