ในปัจจุบัน กระบวนการรับนักศึกษาหรือบุคลากรเข้าสู่ระบบนิเวศนวัตกรรมมักประสบปัญหาจากรูปแบบข้อมูลเริ่มต้น (Student Profile) ที่มีความหลากหลายและไร้โครงสร้าง (Unstructured Data) เช่น ไฟล์ Resume รูปแบบ PDF หรือ Transcript ที่เป็นเอกสารสแกน ส่งผลให้เกิดความล่าช้าในการตรวจสอบคุณสมบัติและไม่สามารถนำข้อมูลดิบเหล่านี้ไปวิเคราะห์ต่อในเชิงลึกได้ทันที การขาดแคลนระบบอัตโนมัติในการจัดการข้อมูลเหล่านี้ทำให้เสียโอกาสในการคัดกรองบุคลากรที่มีศักยภาพอย่างรวดเร็วและแม่นยำ
โครงการนี้จึงมุ่งเน้นการแก้ปัญหาดังกล่าวด้วยการจัดอบรมเชิงปฏิบัติการแบบเข้มข้น (Intensive Workshop) เพื่อพัฒนาระบบต้นแบบ "Onboarding Agent (OA)" โดยผู้เข้าร่วมโครงการจะได้เรียนรู้การใช้เครื่องมือทางด้าน Data Engineering และ AI เช่น Python, LangChain และ PyPDF2 เพื่อสร้าง Agent ที่ทำหน้าที่เป็นด่านหน้าในการอ่าน จับใจความ และดึงข้อมูลสำคัญ (Entity Extraction) จากเอกสารดิบ เพื่อแปลงให้เป็นข้อมูลที่มีโครงสร้าง (Structured Data) ตามมาตรฐานสากล
การดำเนินงานนี้มีความสอดคล้องกับยุทธศาสตร์การจัดตั้ง "ห้องปฏิบัติการเสมือนสำหรับปัญญาประดิษฐ์เชิงตัวแทน (Agentic Living Lab)" โดย Onboarding Agent จะทำหน้าที่เป็นรากฐานสำคัญในการจัดเตรียมข้อมูล (Data Preprocessing) เพื่อส่งต่อให้กับ Agent ตัวอื่นๆ ในระบบนิเวศทำงานต่อไปได้ เป็นการเชื่อมโยงความรู้ทางทฤษฎีสู่การลงมือปฏิบัติจริงในการพัฒนาระบบฐานข้อมูลสมัยใหม่
เพื่อให้นักศึกษามีทักษะปฏิบัติการขั้นสูงในการจัดการข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data Modeling) และประยุกต์ใช้เทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP)
เพื่อพัฒนาระบบต้นแบบ AI Agent ที่มีความสามารถในการอ่านวิเคราะห์และดึงข้อมูลเฉพาะ (Entity Extraction) เช่น ทักษะ เกรดเฉลี่ย และความสนใจ จากเอกสารสมัครเข้าร่วมโครงการได้โดยอัตโนมัติ
เพื่อจัดเตรียมและออกแบบโครงสร้างฐานข้อมูลนักศึกษา (Student Database Schema) ที่มีประสิทธิภาพ รองรับการใช้งานจริงในแพลตฟอร์ม Agentic Living Lab
ระยะที่ 1: การเรียนรู้พื้นฐานและการเตรียมเครื่องมือ (Foundation & Setup)
บรรยายและติดตั้งระบบ (Lecture & Setup):
User/Role: วิทยากรและทีมงานเทคนิค
Action: ปูพื้นฐาน Unstructured Data, NLP และติดตั้ง Environment สำหรับพัฒนา (Python, Database)
ระยะที่ 2: ปฏิบัติการพัฒนา (Development & Hackathon)
Workshop เชิงปฏิบัติการ (Hands-on Workshop):
User/Role: ผู้เข้าร่วมโครงการ
Action: ฝึกปฏิบัติการใช้ Libraries (PyPDF2, LangChain) เพื่อดึงข้อมูลจากเอกสารจริง
การพัฒนาและเชื่อมต่อ (Integration):
User/Role: ผู้เข้าร่วมโครงการ
Action: พัฒนา Agent และออกแบบ Schema ฐานข้อมูล พร้อมเชื่อมต่อข้อมูลเข้าสู่ระบบ
ระยะที่ 3: การประเมินผล (Evaluation)
นำเสนอผลงาน (Pitching & Demo):
User/Role: ผู้เข้าร่วมโครงการและคณะกรรมการ
Action: นำเสนอระบบต้นแบบและทดสอบความถูกต้องของข้อมูล (Accuracy Test)
ระยะเวลา: 2 วัน (เดือนกุมภาพันธ์ 2569)
สถานที่: สาขาวิชา อาคาร SC3
ได้โมดูลต้นแบบ "Student Profile Generator" ที่สามารถแปลงไฟล์ Resume เป็นข้อมูลในฐานข้อมูลได้จริง
ได้ผังฐานข้อมูลนักศึกษา (Student Database Schema) ที่ถูกต้องตามหลักการและพร้อมใช้งานในระบบ Living Lab
ผู้เข้าร่วมโครงการมีความเชี่ยวชาญในการใช้เครื่องมือ Python Libraries ชั้นนำ (PyPDF2, LangChain) สำหรับงาน Data Pipeline
ผู้เรียนสามารถอธิบายและประยุกต์ใช้หลักการ Unstructured Data Modeling เพื่อแปลงข้อมูลเอกสารเป็นฐานข้อมูลได้
ผู้เรียนสามารถพัฒนาโปรแกรมโดยใช้เครื่องมือ NLP (เช่น Spacy, NLTK) เพื่อสกัดข้อมูลสำคัญ (Entities) จากเอกสารภาษาอังกฤษและภาษาไทยได้
ผู้เรียนสามารถออกแบบ SQL Schema และเชื่อมต่อระบบ AI Agent เข้ากับ Cloud Database Infrastructure ได้อย่างถูกต้อง
วันที่ 1: NLP Foundation & Data Extraction
Introduction to Unstructured Data & AI Agents
Python for Text Processing (Regular Expression, PyPDF2)
Introduction to NLP Libraries (Spacy, LangChain)
Workshop: Building a Resume Parser (Extracting Contact Info, Education)
วันที่ 2: Advanced Integration & Mini-Hackathon
Database Schema Design for Student Profiles
Connecting Python Agent to SQL Database
Mini-Hackathon: Developing "Onboarding Agent" prototype
Final Presentation & Code Review
8. กำหนดการ (Schedule)
วันที่ 1: NLP & Extraction Foundations | สถานที่: สาขาวิชา อาคาร SC3
09:00 - 10:30 น. | Lecture: AI Agents & Data
รายละเอียด: ปูพื้นฐานแนวคิด Agent และข้อมูลไร้โครงสร้าง
10:30 - 12:00 น. | Lab: Python Text Processing
รายละเอียด: การใช้ RegEx และ PyPDF2 จัดการไฟล์เอกสาร
13:00 - 16:30 น. | Workshop: NLP with LangChain
รายละเอียด: การใช้ LangChain ดึงข้อมูล (Entities Extraction)
วันที่ 2: Integration & Hackathon | สถานที่: สาขาวิชา อาคาร SC3
09:00 - 10:30 น. | Lecture: Database Design
รายละเอียด: ออกแบบ Schema เพื่อรองรับข้อมูล Resume
10:30 - 12:00 น. | Lab: Agent-Database Integration
รายละเอียด: เชื่อมต่อ Agent ส่งข้อมูลเข้า Database
13:00 - 15:30 น. | Mini-Hackathon
รายละเอียด: แข่งขันพัฒนา Onboarding Agent ให้สมบูรณ์
15:30 - 16:30 น. | Demo & Closing
รายละเอียด: นำเสนอผลงานและมอบประกาศนียบัตร