Το captionbot της Microsoft περιγράφει εικόνες έτσι ώστε να μην χρειαστεί

Βίντεο: ! TITLE THIS IMAGE ! 2024

Βίντεο: ! TITLE THIS IMAGE ! 2024
Anonim

Η Microsoft έχει ξεκινήσει ένα εργαλείο αναγνώρισης εικόνων που επιχειρεί να περιγράψει το περιεχόμενο μιας εικόνας. Αυτό το εργαλείο τεχνητής νοημοσύνης βρίσκεται ακόμα στο στάδιο της ανάπτυξης και συνεχώς μαθαίνει από εικόνες που ανεβαίνουν οι χρήστες.

Όσον αφορά την ακρίβεια, μερικές φορές η περιγραφή είναι αρκετά ακριβής, ενώ μερικές φορές το CaptionBot προσφέρει περιγραφές που δεν έχουν καμία σχέση με αυτό που απεικονίζεται. Υπάρχουν επίσης περιπτώσεις όπου η εφαρμογή δεν μπορεί να παράσχει μια περιγραφή καθόλου, εξαιτίας της κατάστασης της τραχιάς περιφέρειας.

Η Microsoft σχεδίασε το CaptionBot για να μάθει με περισσότερη εμπειρία, με την προσδοκία ότι οι λεζάντες της θα γίνουν πιο ακριβείς με την πάροδο του χρόνου. Όσο περισσότερες φωτογραφίες μεταφορτώνουν οι χρήστες, τόσο καλύτερα γίνεται η εφαρμογή, όπως περιγράφει το CaptionBot:

Μπορώ να καταλάβω το περιεχόμενο οποιασδήποτε εικόνας και θα προσπαθήσω να το περιγράψω, όπως και κάθε άνθρωπο. Μαθαίνω ακόμα, έτσι θα κρατήσω τη φωτογραφία σας αλλά δεν έχω προσωπικές πληροφορίες.

Το CaptionBot χρησιμοποιεί τρεις τεχνολογίες για να περιγράψει τι απεικονίζεται σε μια εικόνα: το Microsoft Computer's Vision, το Emotion και το Bing Image. Το API του Computer Vision εξάγει πλούσιες πληροφορίες από εικόνες για να κατηγοριοποιήσει και να επεξεργαστεί οπτικά δεδομένα παράλληλα με τον εντοπισμό και την εξαγωγή κειμένου από μια εικόνα. Το Emotion API, όπως υποδηλώνει το όνομά του, αναλύει πρόσωπα για να ανιχνεύσει μια σειρά από συναισθήματα, όλα από θυμό, περιφρόνηση, αηδία, φόβο, ευτυχία, ουδετερότητα, θλίψη και έκπληξη. Η εικόνα Bing πραγματοποιεί αναζήτηση στον ιστό για εικόνες.

Δοκιμάσαμε το CaptionBot και τα αποτελέσματα ήταν ακριβή στο 50% των περιπτώσεων. Για παράδειγμα, ανεβάσαμε δύο εικόνες: το ένα απεικονίζει ένα ποντίκι παιχνιδιών, το άλλο ένα στοίβα της κάρτας. Και στις δύο περιπτώσεις, το εργαλείο πρότεινε ότι ήταν ένα κινητό τηλέφωνο. Από την άλλη πλευρά, το CaptionBot ανίχνευσε με ακρίβεια ανθρώπους και πρόσωπα.

Προφανώς, το CaptionBot έχει εμμονή με κινητά τηλέφωνα. Ένας χρήστης του Twitter ανέφερε ότι η εφαρμογή Michelle Obama ήταν κινητό τηλέφωνο. Για περισσότερες αστείες λεζάντες CaptionBot, ελέγξτε αυτή τη σελίδα Twitter.

Μπορείτε επίσης να δοκιμάσετε το CaptionBot εδώ. Δοκιμάστε το: είτε θα βοηθήσετε το εργαλείο να βελτιωθεί είτε θα έχετε καλό γέλιο!

Το captionbot της Microsoft περιγράφει εικόνες έτσι ώστε να μην χρειαστεί