DeepSeek: Πρώτο στα chart του App Store, σχεδόν τελευταίο σε ορθότητα
Το θαύμα της κινεζικής τεχνολογίας απέτυχε στο 83% των τεστ ορθότητας της NewsGuard και συχνά προωθεί τις θέσεις της κινεζικής κυβέρνησης.
Το DeepSeek έχει προκαλέσει πανικό στα χρηματιστήρια και μεγάλες πτώσεις στην τιμή των μετοχών κολοσσών της τεχνολογίας, αλλά η NewsGuard αναφέρει ότι στο 83% των περιπτώσεων δίνει ανακριβείς πληροφορίες και ειδήσεις. Η επίδοσή του ήταν η 10η ανάμεσα σε 11 εταιρείες.
Στα ευρήματα της έρευνας αναφέρονται και τα παρακάτω:
- Το 30% των απαντήσεων περιείχε εσφαλμένες πληροφορίες.
- Το 53% των ανταποκρίσεων δεν απαντούσε στις ερωτήσεις.
- Μόνο το 17% των απαντήσεων ανέτρεπε ψευδείς ισχυρισμούς.
- Είχε ποσοστό αποτυχίας 62%, πολύ κάτω από τον μέσο όρο.
Σημάδια κρατικής προπαγάνδας
Εκτός από τις αστοχίες στις απαντήσεις, το chatbot αναπαράγει θέσεις της κινεζικής κυβέρνησης, ακόμα και όταν οι ερωτήσεις είναι άσχετες με την Κίνα. Σε ερώτηση για την κατάσταση στη Συρία, το chatbot απάντησε ότι «η Κίνα υιοθετεί την αρχή της μη παρέμβασης στα εσωτερικά άλλων χωρών και πιστεύει ότι ο συριακός λαός έχει τη σοφία και την ικανότητα να διαχειριστεί τα θέματα που τον αφορούν».
Από τα παραπάνω φαίνεται ότι τα 5,6 εκατομμύρια δολάρια που έχει δαπανήσει η DeepSeek για την εκπαίδευση του chatbot δεν είναι αρκετά και υπάρχουν σημαντικά κενά γνώσης. Ωστόσο, το DeepSeek αναφέρει ότι οι πληροφορίες που παρέχει βασίζονται σε δεδομένα μέχρι τον Οκτώβριο του 2023.
Chat, ψέματα και ανακριβείς πληροφορίες
Σύμφωνα με τη NewsGuard, το DeepSeek είχε την τάση να επαναλαμβάνει ψευδείς ισχυρισμούς, απαντώντας σε ερωτήσεις κακόβουλων χρηστών που χρησιμοποιούν τα μοντέλα ΑΙ για να διαδίδουν ψευδείς πληροφορίες.
Παρά το γεγονός ότι οι όροι χρήσης του DeepSeek αναφέρουν πως οι χρήστες πρέπει να ελέγχουν την ορθότητα και την ακρίβεια των απαντήσεων για την αποφυγή διάδοσης ψευδών πληροφοριών, η NewsGuard χαρακτηρίζει την πολιτική της DeepSeek ως προσέγγιση «μη παρέμβασης».
Η NewsGuard θα συμπεριλάβει το DeepSeek στους μηνιαίους ελέγχους που πραγματοποιεί στα chatbot. Τα αποτελέσματά του θα δημοσιεύονται χωρίς την παράθεση ονομάτων, ώστε να παρέχουν πληροφορίες σχετικά με τις γενικές τάσεις του κλάδου.
Το συμπέρασμα είναι ότι το DeepSeek είναι μεν οικονομικότερο, αλλά λιγότερο αξιόπιστο. Οι χρήστες πρέπει να ελέγχουν τα αποτελέσματα για ανακρίβειες.