dimanche 15 mars 2020

Federico Pucci: riscrivere la storia della traduzione automatica

Questo post raccoglie rispettivamente le versioni originali, in italiano, francese e inglese, riassunte in questa pubblicazione di SlideShare.


*

Con Federico Pucci, la storia della traduzione automatica nel XX° secolo cambia fisionomia e va riscritta dagli anni '30 in poi:

1929 (dicembre): Federico Pucci presenta per la prima volta a Salerno il suo studio sul "traduttore meccanico".

1930: partecipazione alla prima Esposizione Dopolavoristica Nazionale di Arte e Mestieri di Bolzano - sezione letteraria, di Federico Pucci col suo concetto di "traduttore meccanico", premiato con medaglia d'argento.

1931: Federico Pucci pubblica a Salerno la parte I di quello che è verosimilmente il primo libro mai pubblicato nel mondo su di un dispositivo di "traduzione meccanica": "Il traduttore meccanico ed il metodo per corrispondersi fra Europei conoscendo ciascuno solo la propria lingua: Parte I (Traduzioni dalla lingua estera)."


1932: costruzione probabile di una prima "macchina da tradurre" da parte di Georges Artsrouni, distrutta in seguito; non è stato conservato alcun documento che la riguardi, tranne una fotografia che non consente di fornirne una descrizione. (Fonte)

1932: Warren Weaver diventa direttore della Fondazione Rockfeller

1933: deposito del brevetto e presentazione alle autorità sovietiche della macchina di Petr Petrovič Smirnov-Trojanskij, probabilmente rimasta allo stato di piani e descrizioni. (Fonte)


1933-1935: costruzione del "cervello meccanico" di Georges Artsrouni:


1935: presentazione del "traduttore meccanico" di Federico Pucci al Concorso d'invenzioni aperto nell'ambito della Fiera di Parigi, premiato con diploma e medaglia d'argento per "un metodo per tradurre le lingue senza conoscerle"! (Fonte)

1937: Georges Artsrouni presenta alcune macchine all'Esposizione Nazionale di Parigi, il cui principio fu ricompensato da un diploma di Gran Premio per la meccanografia, secondo l'inventore stesso.

1939-1945 : Seconda Guerra Mondiale

L'attività editoriale di Federico Pucci s'interrompe tra il 1931 ed il 1949, periodo che corrisponde all'anteguerra, alla guerra e al dopoguerra, del quale si sa molto poco su Federico Pucci, se non, oltre alla sua partecipazione ad alcune Esposizioni ed alla sua attività di censore, quello che dice lui stesso:
Poi viene la guerra e lo scrivente cerca di spostare i propri studii nel piano militare, riesce infatti a creare i traduttori meccanici C e D; (...) dovevano partecipare alla Mostra della Tecnica del 1940; tuttavia il Ministero della Guerra oppose il proprio veto alla partecipazione stessa, io venni chiamato a Roma per chiarimenti sulla invenzione; questa fu riconosciuta esatta ed io venni autorizzato a costruire l’apparecchio a spesa dello stato per i primi esperimenti, in quanto avevo fatto presente la mia incapacità finanziaria di costruirli. Venni naturalmente obbligato a serbare il silenzio. Tuttavia non essendo io meccanico pensai che per costruire l’apparecchio avrei dovuto avvalermi dell’opera di terzi, i quali avrebbero potuto non serbare il segreto; non volli correre rischi e declinai l’incarico abbandonando l’invenzione nelle mani del Ministero della Guerra perché ne facesse l’uso che riteneva opportuno.
Un buco nero che sarebbe particolarmente interessante colmare... 

* * *

La découverte de Federico Pucci bouleverse totalement l'histoire de la traduction automatique, qui doit être réécrite au XXIe siècle.

J'ai déjà fait une première tentative, qui s'est avérée être un échec total. Peu importe. Je vais essayer d'être plus précis.

Au siècle dernier, selon toutes les sources disponibles, l’histoire de la traduction automatique est relativement figée, avec une seule ligne de démarcation : l’apparition de l’ordinateur.

AVANT l'ordinateur, sur la période 1932-1935, nous avons la construction probable d’une première machine à traduire par Georges Artsrouni (1932), suivie en 1933 par le dépôt du brevet et la présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, et entre 1933 et 1935 la construction du « cerveau mécanique » de Georges Artsrouni.

En 1936, Alan Turing publie « On computable numbers »1 et imagine un modèle abstrait du fonctionnement des appareils mécaniques de calcul, tel un ordinateur, en vue de donner une définition précise au concept d’algorithme ou de « procédure mécanique », connu sous l’appellation de « machines de Turing ».

Il est l’un des principaux acteurs du déchiffrement d’Enigma durant la seconde Guerre mondiale, et ouvre la voie à l’informatique moderne en contribuant à la construction des premiers ordinateurs programmables au monde : les Colossus Mark 1 et Mark 2.

APRÈS l’apparition des premiers ordinateurs, il faudra attendre 1946 et la rencontre entre Andrew Booth et Warren Weaver, directeur de la Fondation Rockfeller, et, surtout, le 4 mars 1947, avec la lettre de ce dernier à Norbert Wiener évoquant la possibilité d’utiliser les nouveaux ordinateurs pour la traduction des langues naturelles :
... Also knowing nothing official about, but having guessed and inferred considerable about, powerful new mechanized methods in cryptography - methods which I believe succeed even when one does not know what language has been coded - one naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say "This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode. 
Norbert Wiener lui répond, pour le moins sceptique, le 30 avril 1947 :
Second—as to the problem of mechanical translation, I frankly am afraid the boundaries of words in different languages are too vague and the emotional and international connotations are too extensive to make any quasi mechanical translation scheme very hopeful. I will admit that basic English seems to indicate that we can go further than we have generally done in the mechanization of speech, but you must remember that in certain respects basic English is the reverse of mechanical and throws upon such words as get a burden which is much greater than most words carry in conventional English. At the present tune, the mechanization of language, beyond such a stage as the design of photoelectric reading opportunities for the blind, seems very premature… 
Warren Weaver formalisera son intuition deux ans plus tard, le 15 juillet 1949, avec la publication d’un mémorandum simplement intitulé : Translation, publié in Machine translation of languages: fourteen essays [ed. by William N. Locke and A. Donald Booth (Technology Press of the Massachusetts Institute of Technology, Cambridge, Mass., and John Wiley & Sons, Inc., New York, 1955), p.15-23], qui commence ainsi :
There is no need to do more than mention the obvious fact that a multiplicity of languages impedes cultural interchange between the peoples of the earth, and is a serious deterrent to international understanding. The present memorandum, assuming the validity and importance of this fact, contains some comments and suggestions bearing on the possibility of contributing at least something to the solution of the world-wide translation problem through the use of electronic computers of great capacity, flexibility, and speed.
C'est d'ailleurs après avoir eu vent d'un article publié aux États-Unis le 31 mai 1949 (notamment sur le New York Times et le New York Herald Tribune) sur le lancement de l'ordinateur SWAC (Standards Western Automatic Computer) et les déclarations de Harry Huskey rapportées par un quotidien italien (je n'ai pas encore identifié avec précision de quel Giornale il s'agit). Queste le parole stesse di Federico Pucci:
Le Invenzioni sorprendenti (Los Angeles, 31/05/1949)

Il dott. Harry Huskey, addetto alle ricerche presso l’Istituto per i calcoli analitici ha annunziato l’invenzione di un cervello elettrico capace di tradurre le lingue straniere.

Sul funzionamento dell’apparecchio che in un primo tempo veniva impiegato nelle ricerche matematiche, lo scienziato ha dichiarato: Perché riesca a tradurre le lingue, queste devono essere scritte a macchina. L’ufficio per le ricerche navali ha già stanziato una considerevole somma di danaro per la costruzione del cervello.

Il dott. Huskey è sicuro del perfetto funzionamento della meravigliosa macchina la quale darà une traduzione letterale, parola per parola, e sarà poi cura di chi la usa interpretare il senso della traduzione.

Il cervello elettrico verrà messo alla prova entro un anno al più.
scritte di suo pugno nella sua premier courrier au Conseil National des Recherches italien (en date du 10 juillet 49, seulement 5 jours avant la publication du mémorandum de Weaver !), intitulé : « Cerveau électrique nord-américain pour la traduction des langues étrangères et traducteur électromécanique italien participant à l'exposition-concours d’inventions qui se tiendra du 16 au 29 septembre 1949 à Paris », dans le seul but de revendiquer l'antériorité de son invention...

C'est probablement aussi pour cela qu'il fera en sorte que son annonce soit reprise sur ce même New York Times le 26 août 1949 :

On 26 August 1949, the New York Times reported (page 9) from Salerno: 
Federico Pucci announced today that he had invented a machine that could translate copy from any language into any other language. He said that the machine was electrically operated, but refused to disclose details. He said that he would enter it in the Paris International Fair of Inventions next month.  

Une annonce relayée presque un demi-siècle plus tard par John Hutchins, qui fut le point de départ de ma découverte. Mais malheureusement, comme je pense l'avoir clairement démontré, la "machine à traduire" de Federico Pucci n'a jamais vu le jour !

Cela étant, quand bien même Pucci aurait réussi à construire un prototype de son invention (dont il ne nous reste que la maquette), il serait rangé aujourd'hui sur les mêmes étagères poussiéreuses de l'histoire que les machines d'Artsrouni et de Smirnov-Trojanskij, à savoir une sympathique curiosité totalement dépassée.

En revanche, Federico Pucci nous a laissé bien plus qu'un dispositif obsolète, puisqu'il a consigné noir sur blanc le premier système documenté au monde de traduction automatique à base de règles (RBMT) dans son livre paru à Salerne en 1931 (An IX de l’ère fasciste !), dans la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de « traduction mécanique » : « Il traduttore meccanico ed il metodo per corrispondersi fra europei conoscendo Ciascuno solo la propria Lingua : Parte I. », di cui ecco la copertina :


Cette première partie signifiant donc qu'il y en aurait eu au moins une autre à suivre, ce que l'auteur précise en italien sur la couverture : « En préparation : traduction de la langue nationale vers la langue étrangère (langue française) - Temps nécessaire pour apprendre à traduire : une minute ». Avec 68 pages descriptives, c'est non seulement le premier ouvrage, mais aussi le plus complet de la série : dix livres publiés pendant 30 ans, de 1931 à 1960, consacrés à « ses machines à traduire ».

Dans sa préface au lecteur, rédigée à Salerne le 10 décembre 1930, l'auteur entend démontrer qu'il serait possible de faire correspondre entre eux des étrangers ne connaissant respectivement que leur propre langue (Il presente lavoretto tende a dimostrare che sarebbe possibile corrispondersi fra stranieri, conoscendo ciascuno solo la propria lingua).

Donc, en 1929, M. Pucci présente à Salerno sa méthode pour la première fois, qu'il formalise l'année suivante dans un ouvrage publié début 1931. Dans sa première lettre au CNR, il évoque lui-même l'année :
Fin dal 1930 mi sono interessato del problema di permettere ai popoli di tradurre da una lingua all’altra conoscendo ciascuno solo la propria lingua.
Or, vu l'élaboration sophistiquée d'une telle méthode (qui sera d'ailleurs primée avec une médaille d'argent dès le mois de mai 1935 par le Comité de la Foire de Paris), et avec tout le travail réalisé sur ses "tableaux symboliques", il est évident qu'il devait tenter de théoriser son invention déjà depuis la moitié des années 20, a minima, car il lui aurait été impossible d'écrire un tel ouvrage sans une longue et mûre réflexion au préalable.

Plus étonnant encore, il nous laisse un témoignage de ce que sont indubitablement les deux premiers textes au monde traduits "mécaniquement" : un extrait de la Vita Nuova de Dante traduit de l'italien au français, et un extrait du Zadig de Voltaire traduit du français à l'italien, où l'auteur nous expose très exactement - et de façon très détaillée - la méthode (de fonctionnement de sa machine telle qu'il souhaitait la concevoir) par laquelle il traduit "automatiquement" de l'italien au français, puis du français à l'italien :


En obtenant des résultats - pour un système mécanique conçu en 1930 - absolument remarquables ! À titre de comparaison, voici les traductions automatiques modernes de ce même extrait de Zadig, près de 90 ans plus tard...

Une dernière observation avant de conclure : l'approche unique de Federico Pucci anticipe aussi de près d'un siècle une autre caractéristique de ce qu'est devenue la traduction automatique aujourd'hui : sa dimension universelle, démocratique, abordable et à la portée de tous. Il n'aurait certes pas pensé à sa gratuité, quoique...

Conclusion

Que l'on observe l'histoire de la traduction automatique AVANT ou APRÈS l'apparition de l'ordinateur, dans le premier cas Monsieur Federico Pucci a précédé de quelques années les inventions de MM. Georges Artsrouni et Petr Petrovič Smirnov-Trojanskij, et dans le second d'au moins deux décennies (!) l'intuition de Warren Weaver... 

Donc indépendamment du fait que ni le passé ni le présent ne lui ont rendu justice jusqu'à maintenant, j'espère au moins que l'avenir lui apportera la reconnaissance qu'il mérite en tant que précurseur absolu de la traduction automatique, qui légua dès 1931 à la postérité le premier système connu et documenté de "traduction mécanique à base de règles".

*

Nota : 1 ON COMPUTABLE NUMBERS, WITH AN APPLICATION TO THE ENTSCHEIDUNGSPROBLEM
By A. M. TURING.
[Received 28 May, 1936.—Read 12 November, 1936.]


P.S. Voici ma "première tentative" de réécrire l'histoire de la T.A.

À la lumière de la récente découverte d’un nouveau personnage clé dans l’histoire de la traduction automatique, j’ai pensé qu’il serait bon d’actualiser la « ligne du temps » de cette matière, autour des deux âges de la T.A. :

I. L’âge de fer : de la préhistoire au XXe siècle – Avant le Web 
II. L’âge d’or : XXe et XXIe siècles – Après le Web 

L’articulation sera la suivante :

I. De la préhistoire au XXe siècle – Avant le Web 

Trois grandes étapes :
  1. Le XVIIe siècle 
  2. Années 30 du XXe siècle : les précurseurs 
  3. Les 5 décennies suivantes 


1. Le XVIIe siècle

La « préhistoire » de la T.A. est essentiellement marquée par deux noms : René Descartes et Gottfried Wilhelm Leibniz, qui en jettent certaines bases conceptuelles.

Selon John Hutchins et Harold L. Somers, Descartes et Leibniz envisageaient à cette époque de créer des dictionnaires mécaniques en utilisant des codes numériques universels (« Both Descartes and Leibniz speculated on the creation of dictionaries based on universal numerical codes », in An introduction to machine translation).

Descartes nous en dit plus sur l’invention de la langue universelle dans sa correspondance :
Pour être vraiment telle, une langue doit naître de la « vraie » philosophie et donc procéder d’une réforme qui transpose dans les pensées le même ordre simple et naturel qui existe entre les nombres. Les pensées deviendraient alors claires et simples et il serait « presque impossible » de se tromper. Le premier pas à accomplir, précise Descartes, n’est pas d’inventer les mots primitifs et les caractères de la langue universelle, ni de garantir des temps rapides d’apprentissage, mais d’établir « un ordre entre toutes les pensées qui peuvent entrer en l’esprit humain, de même qu’il y en a un naturellement établi entre les nombres ». On pourrait alors inventer des « mots » et les ordonner comme on ordonne les langages inventés pour représenter les nombres et comme on apprend « en un jour à nommer tous les nombres jusqu’à l’infini, et à les écrire en une langue inconnue, qui sont toutefois une infinité de mots différents », et « faire le même de tous les autres mots nécessaires pour exprimer toutes les autres choses qui tombent en l’esprit des hommes ». Ainsi naîtrait une vraie langue universelle, puisque telle est la langue capable de représenter les pensées ordonnées dans l’esprit de l’homme, les idées simples. Une telle langue s’affirmerait « bientôt parmi le monde » et beaucoup seraient disposés à employer « cinq ou six jours de temps pour se pouvoir faire entendre par tous les hommes ».
La langue universelle ne peut donc naître qu’après avoir ordonné, distingué et énuméré les pensées des hommes de façon à les rendre claires et simples. C’est là « le plus grand secret qu’on puisse avoir pour acquérir la bonne science ». Reposant sur la connaissance des « idées simples », une telle langue deviendrait facile à apprendre, à prononcer et à écrire : « Et si quelqu’un avait bien expliqué quelles sont les idées simples qui sont en l’imagination des hommes, desquelles se compose tout ce qu’ils pensent, et que cela fût reçu par tout le monde, j’oserais espérer ensuite une langue universelle fort aisée à apprendre, à prononcer et à écrire, et ce qui est le principal, qui aiderait au jugement lui représentant si distinctement toutes choses, qu’il lui serait presque impossible de se tromper ».
Une langue universelle est donc une langue des pensées ordonnées, mais aussi des pensées claires et simples. Les mots dont les hommes disposent ne possèdent, au contraire, que des significations confuses, ce qui explique pourquoi on n’entend presque rien parfaitement.
Source : Lettre à Mersenne du 20 novembre 1629, B 24, p. 92-97. « La lettre a été étudiée, dans la littérature critique cartésienne, surtout par rapport au projet de langue artificielle, en y voyant même parfois un antécédent de la caractéristique universelle de Leibniz… »
in DESCARTES : TRADUCTION, VÉRITÉ ET LANGUE UNIVERSELLE
Giulia Belgioioso (Université de Lecce)

*

2. Années 30 du XXe siècle : les précurseurs 

Passons maintenant du début des années 30 au Web, c’est-à-dire du premier « traducteur mécanique » de Federico Pucci à la moderne « traduction automatique neuronale » (voir ici une comparaison...) :

1929 (décembre) : Federico Pucci présente pour la première fois à Salerne son étude sur le "traducteur mécanique".

1930 [mise à jour] : présentation à l'Exposition Nationale de Bolzano, section littéraire, du dispositif "traducteur mécanique" de Federico Pucci, primé avec une médaille d'argent.

1931 : Federico Pucci publie à Salerne la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de "traduction mécanique" : « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue ». 


1932 : construction probable d’une première machine à traduire de Georges Artsrouni, détruite par la suite, aucun document la concernant n'ayant été conservé, si ce n’est une photographie ne permettant pas d'en donner une description. (Source)

1932 : Warren Weaver devient directeur de la Fondation Rockfeller

1933 : dépôt du brevet et présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, sans doute restée à l'état de plans et de description. (Source)


1933-1935 : construction du « cerveau mécanique » de Georges Artsrouni :


1935 : présentation du « traducteur mécanique » de Federico Pucci au Concours d'inventions ouvert dans le cadre de la Foire de Paris (Source)

1937 : Georges Artsrouni présente quelques machines à l'Exposition Nationale de Paris, dont le principe fut couronné d'un diplôme de Grand Prix pour la mécanographie, selon l'inventeur lui-même.

1939-1945 : Deuxième Guerre mondiale

*

3. Les cinq décennies suivantes 
  •  La première décennie (≅1945-1955) : les premiers pas
  •  La deuxième décennie (≅1955-1965) : de l'enthousiasme à la déception 
  •  La troisième décennie (≅1965-1975) : la période calme 
  •  La quatrième décennie (≅1975-1985) : le réveil
  •  La cinquième décennie (≅1985-1995) : la maturité 
Inutile de répéter ici les développements de la T.A. selon la chronologie proposée en 1994 par Jacques ANIS dans « Ordinateurs et traduction : survol d'un demi-siècle » [In: Langages, 28ᵉ année, n°116, 1994. Le traducteur et l'ordinateur. pp. 111-122; doi : 10.3406/lgge.1994.1699], je renvoie le lecteur à la consultation du document source.

À noter que, selon l’auteur, il a essentiellement basé son travail sur le livre de John Hutchins (1986), intitulé « Machine Translation: Past Present Future », le même chercheur chez qui j'ai trouvé mention pour la première fois du nom de Federico Pucci. Or ce dernier a écrit au moins 12 livres sur les langues pendant 35 ans, dont 7 sur le "traducteur (dynamo-) mécanique", de 1931 à 1958, et apparemment, jusqu'à présent, il n'y a jamais eu nulle part aucune trace ni de l'inventeur ni de ses inventions, qu'il aurait pourtant présentées au concours Lépine ! Voilà bien des mystères que j'espère réussir à élucider...

La cinquième décennie chevauche enfin avec l’avènement du World Wide Web, à partir de 1990, année parfois considérée comme celle d'un renouveau de la T.A.

*

II. XXe et XXIe siècles – Après le Web 

Je dois encore développer cette partie, qui est sans aucun doute la plus riche (et donc il me faudra du temps, bien que j'aie déjà posé les premiers jalons), probablement selon l'articulation suivante :
  1. La décennie 1995-2005
  2. De 2006 à aujourd’hui
2006 coïncidant bien évidemment avec la montée en puissance du binôme Google et traduction automatique.

À suivre...

* * *

With Federico Pucci, the history of machine translation in the 20th century now needs to be rewritten from the 1930s onwards:

1929 (December): Federico Pucci presents his study on the “mechanical translator” for the first time in Salerno.

1930: Federico Pucci’s participation in the first National After-Work Arts and Crafts Exhibition of Bolzano – literary section, with his concept of “mechanical translator”, awarded a silver medal.

1931: Federico Pucci publishes in Salerno the first part of what we might consider to be the first book ever published anywhere on a “mechanical translating device”, called: "“The mechanical translator and the method for Europeans to correspond, knowing only their own language: Part I: Translating from foreign language).”"


1932: likely construction of a prototype “translating machine” by Georges Artsrouni, later destroyed. No document has been kept about it, except for a photograph that makes a description impossible. (Source)

1932: Warren Weaver becomes director of the Rockefeller Foundation.

1933: filing of patent and presentation to Soviet authorities of Petr Petrovič Smirnov-Trojanskij’s machine, probably at the design and description stage. (Source)


1933-1935: construction of Georges Artsrouni’s “mechanical brain”:


1935: presentation of Federico Pucci’s “mechanical translator” at the Inventors Competition, part of the Trade Fair of Paris, receiving a silver medal for a “a method for translating languages without knowing them”! (Source)

1937: Georges Artsrouni presents some machines at the National Exhibition of Paris, the principle of which received a Grand Prix award for mechanical data processing, according to the inventor himself.

1939-1945 : World War Two

Federico Pucci’s publishing activity is interrupted between 1931 and 1949, a time corresponding to the pre-war, war and post-war periods, during which little is known about Federico Pucci, apart from his participation in some Exhibitions and his work as a censor, about which he writes:
Then the war came, and I attempted to steer my studies towards a military use. I managed to create mechanical translating devices “C” and “D”, a mechanical solution, attempting to create a new mechanical-based language, with device C working as a transmitter, and D as a receiver device. They were to be submitted to the 1940 Engineering Exhibition, but the War Ministry opposed its participation. I was called to Rome to explain the invention. It was approved, and I was authorised to build and try out the device, at the State’s expense, since I had informed them, I could not afford to build it on my own. Obviously, I was obliged to keep everything secret. However, as I was not a mechanic, I thought that I would need the assistance of other persons, who might not be able to keep the secret. I did not want to run this risk, so I turned down the assignment, and left the invention in the hands of the War Ministry, so that it might do whatever it wanted with the idea.
This marks a big gap in our story that it would be very interesting to fill...

I wish to conclude this post by calling for the intervention of a University or any Authority in the field of Machine Translation, in order to highlight the unique role played by Federico Pucci in the history of MT, and to realize his dream of building prototypes of his manifold “translating machines”, for which he himself provides all the elements needed in his books.

In the fnal analysis, apart from the well-known machines of Georges Artsrouni and Petr Petrovič Smirnov-Trojanskij, which in fact have never had any practical implications in the field, John Hutchins dates the nascent years of machine translation back to the time 1947-1954.

So we can assert without fear of being denied that Mr Federico Pucci is the very first precursor of machine translation as we know it today!

Creative Commons License



Aucun commentaire:

Enregistrer un commentaire

Federico Pucci censurato da Wikipedia.it

In questo 124° anniversario della nascita di Federico Pucci, pubblichiamo l'articolo redatto per Wikipedia.it  nel mese di dicembre 2019...