DetailPage-MSS-KB

Base de connaissances

Numéro d'article: 840817 - Dernière mise à jour: mercredi 30 avril 2008 - Version: 8.1

Sommaire

Résumé

Si vous devez extraire des informations de classeurs Microsoft Excel, de présentations Microsoft PowerPoint, ou de documents Microsoft Word, vous pouvez utiliser plusieurs méthodes. Ces méthodes incluent des appels de programmation API, des formats XML ouverts Office, XML, RTF ou HTML. Si ces méthodes ne répondent pas à vos besoins, vous pouvez être éligibles pour la participation à un programme de format de fichier non soumis à redevance et la réception d'une documentation technique pour certains formats de fichier binaires Microsoft Office.

INTRODUCTION

Cet article décrit plusieurs techniques disponibles pour l'extraction d'informations de classeurs Excel, de présentations PowerPoint et de documents Word.

Plus d'informations

Formats XML ouverts Office

Les formats XML ouverts Office sont conçus de sorte que plusieurs applications sur plusieurs plateformes peuvent créer et utiliser des documents au format XML ouvert Office. Grâce au format XML ouvert Office, vous pouvez manipuler directement le format de fichier. Vous n'avez pas à utiliser des applications Microsoft Office pour créer ou utiliser des fichiers.

Avantages du format XML ouvert Office

  • Ce format est ouvert. Le format XML ouvert Office est concédé et documenté sous licence ouverte. Il est amélioré dans le processus Ecma ouvert de sorte qu'il peut fonctionner avec une large gamme de plateformes, d'applications et d'utilisations.
  • Il s'agit de technologie XML. XML ouvert Office est une technologie standard qui peut être facilement utilisée de manière transparente par de nombreux outils et applications.
  • Il offre une compatibilité descendante et une interopérabilité. Vous pouvez ainsi conserver des documents dans leur format d'origine alors qu'ils sont convertis dans un format ouvert, moderne. En outre, différentes applications peuvent utiliser le format XML ouvert Office avec des résultats prévisibles.
  • Il fonctionne bien avec la prise en charge du schéma XML personnalisé, les mises à jour gratuites pour les versions existantes d'Office, et la prise en charge d'importantes fonctions d'accessibilité pour les travailleurs handicapés.
  • Il est prêt pour le futur. Avec le format XML ouvert Office, vous pouvez utiliser toutes les fonctionnalités des programmes Microsoft Office 2007 pour créer des documents. XML ouvert Office offre des moyens de réduire ou d'étendre ces fonctionnalités tout en conservant leur conformité.
  • Il peut contribuer à améliorer la sécurité. Les procédures et applications de sécurité informatiques peuvent détecter et résoudre plus facilement des problèmes potentiels, et les documents sont moins susceptibles d'être endommagés.
Pour plus d'informations sur le format XML ouvert Office, consultez le document Office Open XML v1.0 draft sur le site Web Ecma International à l'adresse suivante (en anglais) :
http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm (http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm)
Vous pouvez également vous reporter au site Web OpenXMLDeveloper.org à l'adresse suivante (en anglais) :
http://openxmldeveloper.org (http://openxmldeveloper.org)
Les formats XML ouverts Office utilisent les spécifications Open Packaging Conventions pour stocker les informations de fichier XML ouvert Office sur le disque. Pour plus d'informations sur les spécifications Open Packaging Conventions utilisées par XML ouvert Office, consultez la partie 2 « Open Packaging Conventions » du document « Office Open XML v1.0 draft ».

Interfaces de programmation d'applications (API) Office

Les formats de fichier binaire Office sont conçus pour être accessibles via les interfaces de programmation d'applications (API), au lieu d'une manipulation directe du format de fichier. Étant donné la complexité des formats, la manipulation directe peut provoquer une corruption et est vivement déconseillée.

Pour plus d'informations sur les API Office, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) :
http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx (http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx)
Les formats de fichier binaires Office 97-2003 utilisent les API Windows Structured Storage. Les informations spécifiques à Office sont stockées en tant que flux dans ce format plus généralisé. Les éléments courants, par exemple les propriétés de document, sont accessibles via les API Structured Storage et ne requièrent pas d'accès à la documentation du format de fichier binaire Office.

Pour plus d'informations sur les API Structured Storage Windows, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) :
http://msdn2.microsoft.com/en-us/library/aa380369.aspx (http://msdn2.microsoft.com/en-us/library/aa380369.aspx)
Le format binaire Microsoft Excel 2007 (* .xlsb) stocke des enregistrements binaires. Ce format utilise les mêmes technologies de composant et de packaging que SpreadsheetML. SpreadsheetML fait partie du format XML ouvert Office.

Important La lecture ou manipulation directe de la structure peut provoquer une corruption et est vivement déconseillée.

XML

XML est un métalangage en texte brut (langage pour la définition des langages de balisage) basé sur Unicode. XML n'est lié à aucun langage de programmation, aucun système d'exploitation ou fournisseur de logiciels. XML offre l'accès à un grand nombre de technologies pour manipuler, structurer, transformer, et interroger des données. Avec l'utilisation grandissante de XML, il est maintenant généralement accepté que XML n'est pas seulement utile pour décrire de nouveaux formats de documents pour le Web, mais il convient également pour décrire des données structurées. Les données structurées peuvent inclure, par exemple, des informations généralement contenues dans les feuilles de calcul, des fichiers de configuration de programme et des protocoles réseau.

Microsoft Office inclut une prise en charge des schémas XML. Microsoft gère un programme de gestion des licences pour certains schémas XML Office.

Pour en savoir plus sur les schémas XML Office, reportez-vous au site Web de Microsoft à l'adresse suivante pour consulter l'article (en anglais) Microsoft Office System and XML: Bringing XML to the Desktop :
http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx (http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx)

Format RTF (Rich Text Format)

La spécification du format RTF (RTF) est une méthode de codage de texte et de graphiques mis en forme pour un transfert facile entre les programmes. La spécification RTF fournit un format pour les textes et les échange graphiques qui peut être utilisé avec différents périphériques de sortie, environnements d'exploitation et systèmes d'exploitation. RTF utilise le jeu de caractères ANSI (American National Standards Institute), PC-8, Macintosh ou IBM PC pour contrôler la représentation et la mise en forme d'un document, à la fois à l'écran et à l'impression. Avec la spécification RTF, les documents qui sont créés sous différents systèmes d'exploitation et à l'aide de différents logiciels peuvent être transférés entre ces systèmes d'exploitation et ces programmes.

Pour plus d'informations sur la façon d'écrire ou de mettre en oeuvre un exemple de lecteur RTF, reportez-vous au site Web de Microsoft à l'adresse suivante, puis tapez RTF Reader (Lecteur RTF) dans la zone Search MSDN For (Rechercher dans MSDN) :
http://msdn.microsoft.com (http://msdn.microsoft.com)

Schéma XML Visio

Grâce à la documentation Microsoft et une licence non soumise à redevance, clients et partenaires peuvent exploiter le schéma XML dans son outil de visualisation de diagrammes et de données. La disponibilité du schéma Visio fournit une description complète et conforme à W3C du format de fichier XML (Extensible Markup Language) Visio, ce qui permet aux organisations d'accéder aux informations capturées dans leurs diagrammes Visio et des utilisations avec d'autres programmes activés par XML, tels que les systèmes de gestion de la relation client (CRM) et les systèmes de planification des ressources de l'entreprise (ERP), dans le cadre de leurs processus d'entreprise. Pour obtenir plus d'informations et télécharger ces fonctions, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) :
http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9 (http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9)

HTML

Les fichiers HTML sont des fichiers texte qui comportent des informations que les utilisateurs vont voir, et des balises qui indiquent des informations de mise en forme sur le mode d'affichage des informations. Vous pouvez utiliser des fichiers HTML pour stocker, distribuer et présenter des documents et des données Office dans un format qui peut être affiché par la plupart des navigateurs Web tout en conservant le contenu riche et les fonctionnalités des documents Office.

Remarque Dans Microsoft Excel 2007, le format de fichier HTML n'enregistre pas les fonctionnalités qui sont spécifiques à Excel. En outre, le format HTML ne prend pas en charge ou ne restitue pas toutes les fonctionnalités dans Excel 2007 lorsque vous enregistrez un classeur au format HTML.

Pour plus d'informations sur la façon de modifier du HTML, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) :
http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx (http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx)
Pour plus d'informations sur la gestion du code, du HTML et des fichiers de ressources, consultez le site Web de Microsoft à l'adresse suivante (en anglais) :
http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx (http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx)

Programmes aux formats de fichier non soumis à redevance

Formats de fichier binaires Microsoft Office

Microsoft met à disposition des spécifications de format de fichier binaire .doc, .xls, xlsb et .ppt dans le cadre d'un engagement non soumis à redevance de ne pas poursuivre quiconque souhaite implémenter tout ou partie de ces spécifications dans ses produits. L'implémentation inclut la possibilité d'utiliser la documentation des spécifications à des fins d'analyse et de référence légale.

Les formats de fichier Dessin Microsoft Office pour 2007 et Visual Basic pour Applications (VBA) pour 2007 sont également disponibles dans le cadre de ce programme. La documentation qui couvre les spécifications de format de fichier binaire est cumulative et concerne la forme courante des formats de fichier binaire ainsi que les versions antérieures.

Les spécifications de format de fichier binaire Office sont disponibles dans le cadre de l'Open Specification Promise. Pour obtenir la documentation, consultez le site Web de Microsoft à l'adresse suivante (en anglais) :
http://www.microsoft.com/interop/docs/officebinaryformats.mspx (http://www.microsoft.com/interop/docs/officebinaryformats.mspx)

Les informations contenues dans cet article s'appliquent au(x) produit(s) suivant(s):
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
  • Microsoft Excel 2002
  • Microsoft Excel 2000 Standard
  • Microsoft Excel 97 Standard
  • Microsoft Office PowerPoint 2007
  • Microsoft Office PowerPoint 2003
  • Microsoft PowerPoint 2002 Standard
  • Microsoft PowerPoint 2000 Standard
  • Microsoft PowerPoint 97 Standard
  • Microsoft Office Word 2007
  • Microsoft Office Word 2003
  • Microsoft Word 2002 Standard Edition
  • Microsoft Word 2000 Standard Edition
  • Microsoft Word 97 Standard Edition
Mots-clés : 
kbhowto kbexpertiseinter kbinfo KB840817
L'INFORMATION CONTENUE DANS CE DOCUMENT EST FOURNIE PAR MICROSOFT SANS GARANTIE D'AUCUNE SORTE, EXPLICITE OU IMPLICITE. L'UTILISATEUR ASSUME LE RISQUE DE L'UTILISATION DU CONTENU DE CE DOCUMENT. CE DOCUMENT NE PEUT ETRE REVENDU OU CEDE EN ECHANGE D'UN QUELCONQUE PROFIT.
Partager
Options de support supplémentaire
Forums du support Microsoft Community
Nous contacter directement
Trouver un partenaire Microsoft Certified Partner
Microsoft Store