PCIe (component perifèric Interconnect Express)es va anomenar originalment HSI (per a interconnexió d'alta velocitat) i va canviar el seu nom a 3GIO (E/S de tercera generació) abans de finalitzar el seu nom PCI-SIG PCI Express. Un grup de treball tècnic anomenat Arapaho Working Group (AWG) va desenvolupar la norma. Per al primer esborrany, el grup de treball ad hoc només va incloure enginyers Intel; A continuació, es va ampliar el grup de treball ad hoc per incloure socis de la indústria. PCI Express és una tecnologia que està evolucionant i millorant constantment.
Definició i estructura bàsiques
PCIe aconsegueix una comunicació de duplex complet mitjançant línies de senyal diferencials. Cada canal conté un parell de línies de transmissió i recepció, donant suport a diversos dispositius a connectar en paral·lel. Les configuracions comunes inclouen x1, x4, x8, x16, etc. (el nombre representa el nombre de canals de dades transmès simultàniament).
Evolució
PCI Express és una tecnologia que està evolucionant i millorant constantment. Un cop aprovada la versió 7.0, la seva velocitat serà de 512 GB/s; Això és inferior a dos anys després del llançament de PCIe 4.0 amb una velocitat de 16 GT/s. La principal força motriu del model de desenvolupament de PCIe accelerat és la demanda de la computació en núvol; En el passat, PCIe va doblar la taxa de transferència de dades cada 3 a 4 anys, o fins i tot 7 anys. Les xarxes de centres de dades necessiten velocitats més ràpides per passar a 800 gbit Ethernet, i cada vegada més acceleradors d’aprenentatge profund també senten la necessitat de velocitats més altes.
Avantatges bàsics
Amplada de banda alta: amplada de banda total=Amplada de banda d'un sol canal × Nombre de canals (per exemple, la configuració X16 pot arribar a 512 GB/s);
Latència baixa: admet la transmissió de dades en temps real i eviteu els colls d'ampolla del dispositiu;
Compatibilitat: àmpliament utilitzat en dispositius com ara GPU, SSD, targetes de xarxa sense fils i admet el connector calent.
Aplicacions
AI/ML: accelerar la formació i la inferència del model, millorar l'eficiència del processament de dades;
Formació multi-GPU: assolir el paral·lelisme de dades i el paral·lelisme del model i millorar la potència informàtica;
Emmagatzematge d’alta velocitat: admet dispositius de gran capacitat com ara 800g Ethernet i unitats d’estat sòlid d’alta velocitat.






