การเร่งประสิทธิภาพเครือข่าย: ผลกระทบของ RDMA ต่ออีเทอร์เน็ตแบบรวม (RoCE)
2024-12-27
วิวัฒนาการที่รวดเร็วของแอปพลิเคชันที่ต้องใช้การประมวลผลอย่างหนักทำให้มีความต้องการโซลูชันเครือข่ายที่รวดเร็ว มีประสิทธิภาพมากขึ้น และปรับขนาดได้ หนึ่งในเทคโนโลยีเชิงนวัตกรรมใหม่ล่าสุดที่เกิดขึ้นเพื่อตอบสนองความต้องการนี้คือ Remote Direct Memory Access (RDMA) ผ่าน Converged Ethernet (RoCE) เทคโนโลยีอันล้ำสมัยนี้อำนวยความสะดวกในการถ่ายโอนข้อมูลโดยตรงระหว่างระบบโดยไม่ต้องใช้การแทรกแซงของ CPU ช่วยลดเวลาแฝงได้มากและปรับปรุงประสิทธิภาพโดยรวมของระบบ iWave ซึ่งเป็นบริษัทออกแบบ FPGA ที่มีชื่อเสียง อยู่แนวหน้าของความก้าวหน้าครั้งนี้ โดยได้นำโซลูชัน 100G Ethernet ที่แข็งแกร่งมาใช้งาน โดยผสานรวม ERNIC IP (Ethernet RDMA Network Interface Controller Intellectual Property) ของ AMD เข้าในพอร์ตโฟลิโอโมดูลคอมพิวเตอร์ฝังตัวของตน การบูรณาการนี้ถูกกำหนดขึ้นเพื่อปรับปรุงความสามารถของ RDMA ในแอปพลิเคชันประสิทธิภาพสูง
 รูปที่ 1: RoCE ช่วยให้ถ่ายโอนข้อมูลระหว่างระบบโดยตรงได้โดยไม่ต้องให้ CPU เข้ามาแทรกแซง ช่วยลดเวลาแฝงได้อย่างมากและปรับปรุงประสิทธิภาพโดยรวมของระบบ (ที่มาของภาพ: iWave)
รูปที่ 1: RoCE ช่วยให้ถ่ายโอนข้อมูลระหว่างระบบโดยตรงได้โดยไม่ต้องให้ CPU เข้ามาแทรกแซง ช่วยลดเวลาแฝงได้อย่างมากและปรับปรุงประสิทธิภาพโดยรวมของระบบ (ที่มาของภาพ: iWave)
ทำความเข้าใจ RDMA ผ่านการคอนเวอร์จอีเทอร์เน็ต (RoCE)
RDMA เป็นเทคโนโลยีสำคัญที่ช่วยให้สามารถถ่ายโอนหน่วยความจำระหว่างโฮสต์หรือเซิร์ฟเวอร์โดยตรง โดยหลีกเลี่ยง CPU ได้อย่างมีประสิทธิภาพ ความสามารถนี้ช่วยให้ CPU สามารถเน้นที่การทำงานของแอปพลิเคชันและการประมวลผลข้อมูล ส่งผลให้ประสิทธิภาพของเครือข่ายดีขึ้นอย่างเห็นได้ชัด โดยมีความหน่วงน้อยลง โหลดของ CPU น้อยลง และแบนด์วิดท์เพิ่มขึ้น ทั้งหมดนี้ทำได้อย่างคุ้มต้นทุน RoCE เป็นโปรโตคอลเครือข่ายเฉพาะที่ออกแบบมาเพื่อรองรับการดำเนินการ RDMA บนเครือข่ายอีเทอร์เน็ต การใช้ประโยชน์จากโครงสร้างพื้นฐาน Ethernet ที่มีอยู่ทำให้ RoCE เป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการเพิ่มประสิทธิภาพโดยไม่ต้องยกเครื่องการตั้งค่าเครือข่ายปัจจุบันของตน
ประเภทของ RoCE
RoCE แบ่งออกเป็นสองเวอร์ชันที่แตกต่างกันตามอะแดปเตอร์เครือข่ายที่ใช้: RoCE v1 และ RoCE v2
- RoCE v1: โปรโตคอลนี้อนุญาตการสื่อสารระหว่างโฮสต์สองเครื่องที่อยู่ภายในโดเมนการบรอดคาสต์อีเทอร์เน็ต (VLAN) เดียวกัน ใช้ Ethertype 0x8915 และจำกัดเฟรม Ethernet มาตรฐานไว้ที่ 1,500 bytes ในขณะที่อนุญาตให้เฟรมจัมโบ้ Ethernet ขยายได้ถึง 9,000 bytes
- RoCE v2: การแก้ไขข้อจำกัดของ RoCE v1, RoCE v2 ได้แนะนำการปรับปรุงในด้านการหุ้มแพ็คเก็ตด้วยการรวมส่วนหัว IP และ UDP การปรับเปลี่ยนนี้ทำให้ RoCE v2 ทำงานได้อย่างราบรื่นบนเครือข่ายทั้งเลเยอร์ 2 (เลเยอร์ลิงก์ข้อมูล) และเลเยอร์ 3 (เลเยอร์เครือข่าย) จึงรองรับการกำหนดเส้นทางเลเยอร์ 3 และการปรับขนาดได้ในหลายซับเน็ต (subnets) RoCE v2 ซึ่งมักเรียกกันว่า Routable RoCE (RRoCE) ยังเพิ่มการรองรับสำหรับการมัลติคาสต์ผ่าน IP ทำให้การใช้งานมีขอบเขตกว้างยิ่งขึ้น
ERNIC IP: เสริมศักยภาพ RDMA
IP ERNIC (Embedded RDMA enabled NIC) เป็นแกน IP ของตัวควบคุมอินเทอร์เฟซเครือข่าย Ethernet RDMA ที่ปรับแต่งได้ ซึ่งออกแบบมาเพื่อการบูรณาการที่ราบรื่นกับ AMD FPGA, MPSoC และการใช้งาน MAC IP แบบซอฟต์แวร์ โซลูชันนี้โดดเด่นด้วยอัตราข้อมูลสูง ความหน่วงต่ำ และกลไกการถ่ายโอนข้อมูลที่เชื่อถือได้และถ่ายโอนข้อมูลผ่านฮาร์ดแวร์ทั้งหมดผ่านอีเทอร์เน็ตมาตรฐาน iWave ได้แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนาเทคโนโลยีด้วยการนำโซลูชัน 100G Ethernet มาใช้อย่างประสบความสำเร็จ ความสำเร็จนี้เป็นไปได้ด้วยการใช้ ชุดพัฒนาที่ขับเคลื่อนด้วย MPSoC Zynq UltraScale+ ของ iWave ซึ่งบูรณาการ ERNIC IP ของ AMD
ชุดพัฒนา MPSoC Zynq UltraScale+ ได้รับการออกแบบมาโดยเฉพาะสำหรับการสร้างต้นแบบและการประเมินโซลูชัน 100G Ethernet โดยใช้ตัวเชื่อมต่อ QSFP-28 ความเร็วสูง
การตั้งค่าสาธิต
การตั้งค่าสาธิตทั่วไป (รูปที่ 2) ประกอบด้วย:
- ชุดพัฒนาที่ขับเคลื่อนด้วย Zynq UltraScale+ MPSoC ZU19EG ของ iWave
- การ์ดเชื่อม ต่อ Advantech Mellanox ConnectX-5 100G
- Sync 1588 PTP รองรับ NIC 1G
- สายเคเบิล MTP, โมดูล QSFP-28 และ สายเคเบิล Ethernet CAT6 RJ45
- พีซีเซิร์ฟเวอร์ Ubuntu 22.04
 รูปที่ 2: การตั้งค่าทั่วไปสำหรับชุดพัฒนา Zynq UltraScale+ MPSoC (แหล่งที่มาของภาพ: iWave)
รูปที่ 2: การตั้งค่าทั่วไปสำหรับชุดพัฒนา Zynq UltraScale+ MPSoC (แหล่งที่มาของภาพ: iWave)
ภาพรวมสถาปัตยกรรมระบบ
สถาปัตยกรรมระบบได้รับการออกแบบมาเพื่อเพิ่มประสิทธิภาพการถ่ายโอนข้อมูล โดยมีบทบาทที่กำหนดไว้อย่างชัดเจนระหว่างส่วนประกอบของระบบประมวลผล (PS) และลอจิกที่ตั้งโปรแกรมได้ (PL) การใช้งานยังมีการซิงโครไนซ์โปรโตคอลเวลาแม่นยำ (PTP) ซึ่งมีความสำคัญอย่างยิ่งสำหรับแอปพลิเคชันแบบเรียลไทม์ ด้วยมาตรวัดประสิทธิภาพที่โดดเด่น เช่น ความสามารถในการจัดการวิดีโอ 8K ที่อัตรามากกว่า 100 เฟรมต่อวินาที แอปพลิเคชันที่มีศักยภาพจึงขยายไปในหลายภาคส่วน เช่น ศูนย์ข้อมูล มัลติมีเดีย และการประมวลผลประสิทธิภาพสูง เน้นย้ำถึงความหลากหลายและความสำคัญของเทคโนโลยีในสภาพแวดล้อมการประมวลผลสมัยใหม่
สถาปัตยกรรมระดับสูงของระบบซึ่งแสดงในรูปที่ 3 เน้นย้ำถึงบทบาทที่แตกต่างกันของส่วนประกอบ PS และ PL ภายใน Zynq UltraScale+ MPSoC PS มี Hard SoC ที่ใช้ ARM Cortex-A53 ซึ่งจำเป็นสำหรับการกำหนดค่าระบบ การควบคุม และการวินิจฉัย ส่วนประกอบหลักของสถาปัตยกรรมนี้ได้แก่:
- 100G Ethernet MAC Driver: รับประกันประสิทธิภาพที่แข็งแกร่งและการส่งข้อมูลที่มีความหน่วงต่ำที่ 100Gb/s
- ERNIC Controller Driver: รับผิดชอบในการจัดการข้อมูลขาเข้าไปยัง DDR และอำนวยความสะดวกในการสื่อสารระหว่างแอปพลิเคชันผู้ใช้และ ERNIC IP ผ่านการแลกเปลี่ยนกริ่งประตูที่มีประสิทธิภาพ
- RDMA Core and User Space Libraries: รับประกันความเข้ากันได้และประสิทธิภาพที่เหมาะสมที่สุดสำหรับการดำเนินการ RDMA ทั้งบนเคอร์เนลและพื้นที่ผู้ใช้
 รูปที่ 3: จุดเด่นของบทบาทที่โดดเด่นของระบบประมวลผลและส่วนประกอบลอจิกที่ตั้งโปรแกรมได้ภายใน Zynq UltraScale+ MPSoC (ที่มาของภาพ: iWave)
รูปที่ 3: จุดเด่นของบทบาทที่โดดเด่นของระบบประมวลผลและส่วนประกอบลอจิกที่ตั้งโปรแกรมได้ภายใน Zynq UltraScale+ MPSoC (ที่มาของภาพ: iWave)
AMD ERNIC IP มีประสิทธิภาพในการถ่ายโอนสแต็ก RoCE v2 ไปยัง FPGA โดยที่ ERNIC Controller ทำหน้าที่จัดการการแฮนด์เชคระหว่างโมดูลต่างๆ เพื่ออำนวยความสะดวกในการถ่ายโอนข้อมูล สร้างรายการคิวงานและส่งการแจ้งเตือน (กริ่งประตู) ไปยัง ERNIC IP ในขณะเดียวกัน ระบบย่อย 100G อีเทอร์เน็ต ของ Zynq UltraScale+ MPSoC จะจัดการ MAC และเลเยอร์กายภาพ ในขณะที่เครื่องสร้างรูปแบบข้อมูลจะรับผิดชอบในการสร้างข้อมูลดิบและรูปแบบข้อมูลวิดีโอ
โปรโตคอลเวลาความแม่นยำ (PTP)
ค่าประทับเวลา PTP (มาตรฐาน IEEE 1588) มีบทบาทสำคัญในการซิงโครไนซ์เวลาในระบบต่างๆ บนเครือข่ายอีเทอร์เน็ต การซิงโครไนซ์นี้มีความสำคัญอย่างยิ่งต่อการเพิ่มประสิทธิภาพของแอปพลิเคชันแบบเรียลไทม์ ช่วยให้สามารถแลกเปลี่ยนข้อมูลแบบซิงโครไนซ์และมีความหน่วงต่ำที่ระดับนาโนวินาทีได้
ไฮไลท์สำคัญของการตั้งค่า
คุณสมบัติที่โดดเด่นของการตั้งค่านี้ได้แก่:
- การนำ 100G อีเทอร์เน็ต ไปใช้บน RoCE v2 โดยใช้ AMD ERNIC IP
- ประเภทการขนส่งการเชื่อมต่อที่เชื่อถือได้
- ฟังก์ชัน RDMA SEND, RDMA READ และ RDMA WRITE สำหรับการจัดการแพ็คเก็ต
- รองรับประเภทข้อความ RDMA Send with Immediate และ RDMA Write with Immediate
- การทดสอบประสิทธิภาพสำหรับ RDMA โดยใช้แอปพลิเคชัน XRPING และ PERFTEST
- เครื่องกำเนิดรูปแบบข้อมูลที่กำหนดเองสำหรับรูปแบบข้อมูล RAW และวิดีโอ
- การแทรกค่าประทับเวลา PTP ควบคู่ไปกับข้อมูล
สถิติปริมาณงานโดยละเอียดสำหรับการถ่ายโอนข้อมูลวิดีโอจากชุดพัฒนา Zynq UltraScale+ MPSoC ไปยังเซิร์ฟเวอร์พีซีเผยให้เห็นประสิทธิภาพที่น่าประทับใจด้วยความสามารถในการจัดการวิดีโอ 8K ที่มากกว่า 100fps และวิดีโอ 4K ที่มากกว่า 400fps
การประยุกต์ใช้งานที่มีศักยภาพ
การบูรณาการของ RDMA บน Converged Ethernet และ ERNIC IP จะเปิดช่องทางใหม่ๆ ให้กับอุตสาหกรรมต่างๆ ช่วยเพิ่มการเชื่อมต่อ ประสิทธิภาพการทำงาน และประสิทธิผลในแอปพลิเคชันต่างๆ อย่างมีนัยสำคัญ รวมถึง:
- Datacenters and cloud computing: อำนวยความสะดวกในการสื่อสารระหว่างเซิร์ฟเวอร์อย่างมีประสิทธิภาพและเร่งการประมวลผลข้อมูลในสถาปัตยกรรมระบบคลาวด์
- Video/image capture and transfer: เป็นประโยชน์สำหรับแอปพลิเคชันมัลติมีเดีย การออกอากาศ และสภาพแวดล้อมเสมือนจริง (VR)
- Storage solutions: ช่วยให้ถ่ายโอนข้อมูลระหว่างอุปกรณ์จัดเก็บข้อมูลและเซิร์ฟเวอร์ได้รวดเร็วยิ่งขึ้น จึงช่วยปรับปรุงประสิทธิภาพของระบบจัดเก็บข้อมูล
- High-performance computing (HPC): เพิ่มความเร็วในการถ่ายโอนข้อมูลและลดเวลาแฝงภายในคลัสเตอร์ HPC สำหรับงานคำนวณและการจำลองที่รวดเร็วยิ่งขึ้น
- IoT Edge devices: ช่วยให้สามารถรวบรวมและส่งข้อมูลแบบเรียลไทม์จากเซ็นเซอร์และอุปกรณ์ต่าง ๆ ได้
เนื่องจากความต้องการโซลูชันการถ่ายโอนข้อมูลที่เร็วขึ้นและมีประสิทธิภาพมากขึ้นยังคงเพิ่มขึ้น RDMA บน Converged Ethernet และ ERNIC IP จึงพร้อมที่จะมีบทบาทสำคัญในอนาคตของการประมวลผลประสิทธิภาพสูง
บทสรุป
กลุ่มผลิตภัณฑ์แพลตฟอร์ม FPGA และ SoC FPGA ที่หลากหลายของ iWave รวมกับความเชี่ยวชาญทางเทคนิคอันล้ำลึก ช่วยให้ลูกค้าสามารถพัฒนาผลิตภัณฑ์ล้ำสมัยที่ใช้ประโยชน์จากความก้าวหน้าล่าสุดในด้านปัญญาประดิษฐ์ (AI) การเรียนรู้ของเครื่องจักร และการประมวลผลแบบ edge ด้วยการเป็นพันธมิตรกับ iWave บริษัทต่างๆ จะสามารถเร่งการพัฒนาผลิตภัณฑ์ ลดความเสี่ยง และก้าวล้ำหน้าคู่แข่งขันในภูมิทัศน์ด้านเทคโนโลยีที่ซับซ้อนมากขึ้นเรื่อยๆ
หากต้องการข้อมูลเพิ่มเติมหรือหารือเกี่ยวกับข้อกำหนดที่กำหนดเอง โปรดติดต่อเราที่ mktg@iwave-global.com
Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.
 
                 
                 
                 
 
 
 
 การตั้งค่า
        การตั้งค่า
     จัดส่งที่รวดเร็ว
                                    จัดส่งที่รวดเร็ว
                                 จัดส่งฟรี
                                     จัดส่งฟรี
                                 Incoterms
                                    Incoterms
                                 ประเภทการชำระเงิน
                                    ประเภทการชำระเงิน
                                





 ผลิตภัณฑ์ตลาดออนไลน์
                                    ผลิตภัณฑ์ตลาดออนไลน์
                                 
            






 
                 
                     
                                 
                                 
                         
                                 
                                 
                                 
                                 
                                 
                                 
                                 ไทย
ไทย