Inventaire des offres d'API en traitement du language naturel
 Share
The version of the browser you are using is no longer supported. Please upgrade to a supported browser.Dismiss

 
View only
 
 
ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
Nom NetOwlRosetteDandelionTextRazorAmazon ComprehendIBM Watson (NLU, Classifier)MS Cognitive ServicesGoogle Cloud
2
Site webhttps://www.netowl.com/https://www.rosette.com/https://dandelion.eu/https://www.textrazor.com/https://aws.amazon.com/fr/comprehend/https://www.ibm.com/watson/services/natural-language-understanding/ et https://www.ibm.com/watson/services/natural-language-classifier/https://azure.microsoft.com/fr-ca/services/cognitive-services/directory/lang/https://cloud.google.com/natural-language/
3
4
Langues traitéesEnglish, Arabic, Chinese (traditional and simplified), French, German, Korean, Persian (Farsi and Dari), Russian, and Spanish.21 supported languages (incluant français et anglais) (Categorization and Topic extraction are currently only available in English). Donc français seulement pour les entités.English, French, German, Italian, Spanish and Portuguese.English
Chinese
Dutch
French
German
Italian
Japanese
Polish
Portugese
Russian
Spanish
Swedish
Anglais et espagnol («Cela vous permet de créer des applications capables de détecter du texte écrit dans différentes langues, de convertir le texte en anglais ou en espagnol grâce à Amazon Translate, puis d'utiliser Amazon Comprehend afin d'effectuer une analyse du texte.»)Arabic
Chinese (Simplified)
Dutch
English
French
German
Italian
Japanese
Korean
Portuguese
Russian
Spanish
Swedish
Tableau ici: https://docs.microsoft.com/fr-fr/azure/cognitive-services/text-analytics/language-support. Toutefois, selon des textes avec la démonstraction en ligne (https://azure.microsoft.com/fr-fr/services/cognitive-services/text-analytics/), le français n'est pas géré pour l'extration d'entité («Supplied language is not supported. Pass in one of: en,es.»)10 langues dont le français: https://cloud.google.com/natural-language/docs/languages
5
6
Extraction de mots clés, de conceptsOuiOuiOuiOuiOuiOui.
7
8
Extraction d'entités nomméesOuiOuiOuiOuiOuiOuiOui mais non (pas en français? ou pas encore?)Oui
9
Référence à des vocabulaires normésdbpedia typesWikipedia URL, dbpedia URLWikipedia, Wikidata, DBPedia, Freebase?PropriétaireWikipedia ID, Wikipedia URL, Bing IDwikipedia_url, Knowledge Graph MIDs
10
11
Classification des textesOuiOuiOuiOuiIndirectement via la «Modélisation de rubriques»OuiNonOui mais pas en français
12
Taxonomies supportées?IAB Tech Lab Content TaxonomyInternet Advertising Bureau QAG segments, Internet Advertising Bureau Content Taxonomy v2, IPTC newscodes, IPTC Media Topics.n/aAucune n/aTaxonomie propriétaire
13
Configuration de nos propres classifications?«you can use Rosette for other taxonomies if you like with on-premise categorization. This requires establishing a training set of documents for the new taxonomy.»Oui, en fournissant un mapping pondéré entre les catégories et des articles de Wikipédia. https://dandelion.eu/docs/api/datatxt/cl/models/v1/To create a new category, simply give TextRazor a word or two that concisely describes the type of information you are looking for. TextRazor will use this information to build a model that can identify documents that are semantically similar in concept to your words, even if they don't explicitly mention the theme.NonOui (c'est la seule option)n/aOui avec AutoML Natural LanguageBÊTA, mais «The AutoML Natural Language currently supports classification of English language text. You can train a custom model using text in other languages, but model performance is undetermined.»
14
15
Possibilité d'essayer en ligneNon?OuiOuiNon?OuiOui
16
Possibilité d'essayer l'API gratuitementNon?Free up to 10,000 calls/month!Oui (1000 unités gratuites par jour)OuiOuiOuiOuiOui
17
18
Tailles des textes traitésN/aThe maximum payload size is 600KB, with a maximum character count of 50,000.Une note sur le site semble dire que les outils sont optimisés pour des textes courts seulement. «court» n'est pas définit, mais la grille de prix mentionne qu'il faut prévoir +1 unité pour chaque tranche de 4000 caractères. De plus, la documentation mentionne que les requêtes sont limitées à 1048576 octets.Up to 200kb of UTF-8 encoded raw textPas de limite indiquée, mais l'unité de mesure pour les coûts est par unité de 100 caractères.Entités: Natural Language Understanding truncates analyzed text that contains more than 50,000 single-byte or multibyte characters.

Classifier: Limit the length of input text to fewer than 60 words.
La taille des documents doit être inférieure à 5 000 caractères par document et vous pouvez avoir jusqu'à 1 000 éléments (ID) par collection. Autour de 1000000 octets, mais d'autres limites s'appliquent: https://cloud.google.com/natural-language/quotas
19
20
API?RESTRESTRESTRESTRESTRESTRESTREST
21
SDK et/ou intégrationsNetOwl integrates easily with many popular search, geospatial, and business intelligence tools such as Elasticsearch, Solr, MarkLogic, Esri ArcGIS, Tableau, Kibana, etc.cURL | Python | PHP | Java | C# | NodeJS | Ruby | R; ElasticSearch, Solr, Salesforce et RapidMinerGoogle Suite, Ruby, Python, NodeJS, OpenRefine, Virtuoso, NERD, Apache StanBol, WordpressPython, PHP, JavaJava, Python, PHP, Javascript, Ruby, .Net, GoAndroid, Node, Java, Python, Ruby, .Net, OpenWhisk, Salesforce, Swift, Unity.C#, Java, Node.js, Python, GoC#, GO, JAVA, NODE.JS, PHP, PYTHON, RUBY
22
23
D'intérêt pour Projet TAMIS (français, longs textes?)À vérifierPartiel (seulement les entités en français, et longueur à 50000 caractères limite un peu)Peut-être -- dépend de l'application de la limite de taille.OuiNonOui.Non (à moins de réussir à faire fonctionner l'extration d'entités en français)Oui pour les entités seulement (puisque la classification ne fonctionne pas en français)
24
Intérêt à tester le classificateur personnalisé?NonNonNonOuiNonNonNonOui
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Loading...
Main menu