Το chip που «ρίχνει» το κόστος της AI και αλλάζει το παιχνίδι του inference
2026-01-28 - 08:32
Η Microsoft παρουσιάζει το επόμενο μεγάλο ορόσημο στις υποδομές τεχνητής νοημοσύνης: το Maia 200, έναν νέο επιταχυντή σχεδιασμένο ειδικά για το στάδιο της παραγωγής αποτελεσμάτων, το λεγόμενο inference, με στόχο να αλλάξει τον τρόπο που αξιοποιείται η AI σε μεγάλη κλίμακα. Το inference είναι η «στιγμή της απάντησης». Δηλαδή, όταν ένα σύστημα τεχνητής νοημοσύνης ανταποκρίνεται σε ένα prompt, παράγει περιεχόμενο ή υποστηρίζει αποφάσεις σε πραγματικό χρόνο. Καθώς η AI ενσωματώνεται ολοένα και περισσότερο σε καθημερινά εργαλεία, το συγκεκριμένο στάδιο γίνεται πιο κρίσιμο από ποτέ, μετατοπίζοντας την προσοχή σε τρεις βασικούς άξονες: ταχύτητα, κόστος και δυνατότητα κλιμάκωσης, ακριβώς τη στιγμή που ο χρήστης περιμένει αποτέλεσμα. Η Microsoft τονίζει ότι, παρότι μεγάλο μέρος της συζήτησης διεθνώς έχει επικεντρωθεί στο πώς «εκπαιδεύονται» ή τροφοδοτούνται τα μοντέλα με δεδομένα, η πραγματική χρήση στον κόσμο γίνεται αμέσως μετά, όταν τα συστήματα καλούνται να απαντήσουν. Κάθε ερώτηση σε ένα οικοσύστημα AI, είτε σε εργαλείο εργασίας, είτε σε αλληλεπίδραση με πελάτη, είτε σε μια δημιουργική ροή εργασίας,