Back to site
Since 2004, our University project has become the Internet's most widespread web hosting directory. Here we like to talk a lot about web development, networking and server security. It is, after all, our expertise. To make things better we've launched this science section with the free access to educational resources and important scientific material translated to different languages.

Un standard deschis pentru Reprezentarea Structura chimică - identificator chimic IUPAC

Source: http://www.hellers.com/steve/resume/p157.html

 

 

Stephen E. Stein, Stephen R. Heller, şi Dmitrii

Tchekhovski

Proprietăţi fizice şi chimice Division, NIST

Gaithersburg, MD 20899 Statele Unite ale Americii

 

E-mailuri: steve.stein @ nist.gov,

srheller@nist.gov,

dmitrii.tchekhovskoi @ nist.gov

 

 

 

Abstract

 

IUPAC a fost mult timp implicat în dezvoltarea de proceduri sistematice şi de standard de denumire pentru substanţele chimice pe baza de structura lor. Normele care rezultă din nomenclatură, în timp ce acoperă aproape toate compuşi, au fost concepute pentru text pe bază de mass-media. IUPAC este în curs de dezvoltare acum un mijloc de reprezentare a substanţelor chimice într-un format mai potrivit pentru procesare digitală, care implică prelucrarea pe calculator a informaţiilor chimice structurale (tabele de conectare). Acest lucru este în curs de implementare în cadrul proiectului chimice Identifier IUPAC, ale cărui detalii vor fi discutate în această prezentare.

 

 

Fundal

 

În martie 2000 IUPAC convocat o reuniune la Washington DC pentru a privi în materie de reprezentare structurii chimice (1). Reuniunea a Strategiei de la Masa Rotundă IUPAC a fost numit Reprezentări ale structurii moleculare: Nomenclatorul şi alternativele sale. Acesta a reunit 41 de participanţi din 10 ţări, inclusiv experţi în organice, anorganice, nomenclatura biochimice, macromoleculare şi, utilizatorii de nomenclatura în mediul academic, industrie, brevet de inventie, comerţ internaţional, sănătate şi comunităţi de siguranţă; editorilor revistelor şi editori, furnizori de baze de date şi software-ului vânzătorii.

 

 

În ultimii zece ani cu dependenţa tot mai mari privind prelucrarea pe calculator de către chimişti, a devenit evident pentru mulţi în cadrul IUPAC că această organizaţie ar trebui să găsească metode mai bune de manipulare nomenclatura a fost făcut în trecut. În special, aceasta a fost resimţit de către autori care au subliniat în timp ce IUPAC denumiri chimice conventionale / nomenclatura în secolul 20, a continuat progresul în cele 21 de st secol necesare noi, calculator bazate pe abordări ale problemei de identificare chimice.

 

La reuniunea de la luna martie 2000, autorii a prezentat o propunere de IUPAC, care a prelungit un dezvoltat de unul dintre autori (SRH), în toamna lui 1999. propunerea iniţială, din noiembrie 1999 a fost de largă circulaţie, cu informaţii chimice şi reprezentarea structurii chimice comunitate prin e-mail. Propunerea prezentate la reuniunea martie 2000 a fost reţinut îmbunătăţirile considerabile de la acest feedback de la chimişti în Statele Unite ale Americii, Europa, şi Asia.

 

La sfârşitul lunii martie 2000 Town Bill reuniune (2) a propus ca noul program să fie numit chimică IUPAC Identifier Project (IChIP)

 

Scopul proiectului chimică IUPAC Identifier (IChIP) este de a stabili o etichetă unică, IUPAC chimice Identifier (Ichi), ceea ce ar fi un identificator non-proprietate pentru substanţele chimice care ar putea fi utilizate în surse tipărite şi electronice de date care să permită, astfel, mai uşor legarea de diverse compilatii de date şi de identificare fără echivoc a substanţelor chimice.

 

Ichi nu este un sistem de registre. Aceasta nu depinde de existenţa unei baze de date de înregistrări substanţă unică de a stabili urmatorul numar secventa disponibil pentru orice substanţă chimică nouă fiind atribuit un Ichi. Acesta va fi bazat pe un set de convenţii structura IUPAC, precum şi normele de normalizare şi de canonicalization (3) din o reprezentare structură de intrare pentru a stabili etichetă unică. Aceasta va permite, astfel, o conversie automată de o reprezentare grafica a unei substanţe chimice în etichetă unică Ichi, care poate

fi create independent de orice organizaţie oriunde în lume şi care ar putea fi construite în orice program de desen structura chimică şi a creat de la orice colecţie existentă a structurilor chimice.

 

Ca urmare a reuniunii şi recomandări în raport (1), cu următorul text a fost aprobat de către IUPAC În aprilie 2000 (4,5):

 

1. Un Comitet ad hoc privind chimice de identitate si Sisteme Nomenclatura (CCINS) a fost stabilit, cu Dr. Alan D. McNaught (6) în calitate de preşedinte. CCINS este responsabil pentru dezvoltarea de sisteme de calculator şi convenţionale pe bază de nomenclaturi chimice, a cooperat cu cele patru curent IUPAC Comisiilor nomenclatura; coordonarea activităţilor interdisciplinare în domeniul nomenclaturii şi recomandând la Biroul cu rază lungă de strategie privind nomenclaturi chimice. Este de aşteptat ca acest organism va oferi planificarea pe termen lung centrale, gestionarea şi coordonarea de nomenclaturi chimice, care altfel ar fi pierdute în cazul în care Comisiile au fost întrerupte la sfârşitul anului 2001.

 

2. Un studiu de fezabilitate al proiectului identificator chimic, care urmează să fie gestionate de CCINS, a fost iniţiată. Un "identificator de substanţe chimice" este destinat să fie un şir de text alfanumeric semnificativ care poate identifica în mod unic un compus chimic şi de a facilita manipularea în bazele de date de calculator. Acest cod ar fi echivalentul unui nume sistematice IUPAC, dar ar fi concepute pentru a fi informaţii despre substanţa specifice în cauză. Deoarece există multe probleme care trebuie rezolvate, participanţii la Masa Rotundă Nomenclatura recomandă ca fezabilitatea proiectului şi rezolvarea acestor probleme să fie efectuate cât mai curând posibil de către reprezentanţi ai unei game largi de părţi interesate. Doctorii. Stephen R. Heller şi Steve Stein (NIST) au fost rugaţi să recomande o listă de indivizi şi grupuri care ar trebui să fie consultate iniţial şi să propună un cadru pentru abordarea problemelor.

 

3. IUPAC a fost de acord să joace un rol principal în reprezentarea comunităţii internaţionale de chimie în dezvoltarea de Chimie Markup Language (CML) (7), care este o extensie a XML mai generale (Extended Markup Language) cu capacitatea de speciale pentru a trata informaţiile chimice. XML este un nou standard fiind adoptat de către editori web la nivel mondial. Este de aşteptat să înlocuiască HTML standardul actual în următorii câţiva ani.

 

În luna august 2000 o reuniune a avut loc la Cambridge din Marea Britanie pentru a discuta o serie de aspecte tehnice înainte de muncă efectivă la proiect a început. O propunere detaliată a fost apoi pregătit şi IUAPC a solicitat asistenţă de la NIST pentru a oferi cea mai mare parte a suportului tehnic pentru proiect. În decembrie 2000, proiectul a fost aprobat de către IUPAC şi a început oficial la 1 ianuarie 2001 (3). Rapoartele iniţiale asupra proiectului au fost prezentate la a 38 IUPAC Congresului - vorbi invitat pe Ichi IUPAC proiectului - iulie 2001,

la reuniunea ACS Naţional din Chicago, Illinois - august 2001, Conferinţa CAS / IUPAC privind chimice Identificatori şi XML pentru Chimie, iulie 2002, şi la Conferinţa de guvernul Statelor Unite pe baze de date chimice - iulie, 2003 (8). În plus, o serie de articole au apărut în publicaţii chimie şi ştiinţa cu privire la proiectul ichi (9-12).

 

Introducere:

 

 

Obiectul cel mai utilizat pe scara larga, si poate cel mai bine înţeleasă în discuţie în chimie este compusul chimic. Desigur, vom defini compuşi chimici de structura lor chimica, ca de obicei se arată în diagrame 2D sau stocate în computere ca tabele de conectare.

Pronunţa numele au fost dezvoltate pentru comunicare orală şi scrisă, deşi derivarea unui nume dintr-o structură poate solicita regulilor extrem de complexe cunoscute doar de experţi. Intelegerea aceste nume necesită inversarea procesului de numire a obţine structura originală. Ele sunt mijloace indirecte şi foarte ineficientă de identificare a substanţelor chimice.

 

În era digitală actual, în cazul în care compuşii sunt reprezentate digital, nevoia de identificare eficace nu este mai puţin importantă. Eliberat de la restricţia de pronounceability, identificatori chimici poate fi legat mai direct de structuri. De fapt, ele pot fi derivate direct din structura de algoritm astfel încât orice structură care pot fi trase pot fi identificate.

Proiectul Ichi isi propune sa dezvolte un astfel de set de algoritmi pentru a servi ca identificatorul unic pentru fiecare compus, semnătura digitală. Deoarece o serie de caractere este metoda de stocare şi transmitere a informaţiilor, o astfel de şir de caractere, derivate dintr-o structura, este formatul de ieşire.

 

 


În timp ce descrierea cea mai fundamentală a identităţii unui compus este structura sa, acest lucru necesită o imagine, care nu este utilizabil pentru vorbire şi de multe ori incomod pentru text. Utilizarea de nume se poate pronunţa este foarte eficient pentru substanţele comune, care

Figura 1 Probleme cu identificatori chimice existente

 

 

În timp ce descrierea cea mai fundamentală a identităţii unui compus este structura sa, acest lucru necesită o imagine, care nu este utilizabil pentru vorbire şi de multe ori incomod pentru text. Utilizarea de nume se poate pronunţa este foarte eficient pentru substanţele comune, care obţin adesea un nume banal, dar poate fi greoaie sau imposibil pentru compuşi complecşi.

După cum se poate vedea din figura 1, se poate argumenta că principalele probleme cu produse chimice de identificare este că există prea mulţi dintre ei. Din punct de calculator standard, toate sunt defecte. Figura 2 indică ceea ce este necesar pentru a avea un identificator bun.

 

Figura 2: Ce fel de Identifier este necesar?

 

 

Cerinţele de bază, după cum sa menţionat mai jos în figurile 3 şi 4, care sunt compuşi diferiţi au nevoie de identificatori diferiţi şi acelaşi compus trebuie să dea acelaşi identificator.

 

 

 

 

 

Figurile 3 şi 4: Cerinţe pentru un identificator chimică bună

 

 

 

Ichi versiune beta Capabilităţile

 

Figura 5 Capabilităţile iniţială a algoritmului Ichi

 

 

 

Figura 6 Primele trei paşi pentru a crea un Ichi

Figura 7 Ichi simplificări

 

 

Figura 8 Ignorarea densitatea de electroni de o structură chimică

 

Cifre 6,7, şi 8 arată cele 3 paşi pentru a obţine o Ichi, inclusiv normalizarea şi simplificări utilizate, inclusiv ignorând densitate de electroni.

 

 

 

 

Figura 9 straturi iniţial utilizate în algoritmul de Ichi

 

 

Figura 9 prezinta abordare extrem de flexibilă stratificată fiind luate pentru a fi în măsură să reprezinte toate aspectele legate de un produs chimic. Abordarea stratificat este logic (separate variabile), uşor de înţeles, nu are nici o semnificativă a costurilor de calcul. De asemenea, este foarte flexibil pentru chimişti reprezenta nivelul cunoscut de informaţii. Este foarte uşor să adăugaţi mai multe straturi după cum este necesar pentru a acoperi polimeri, structurile Markush, aliaje, clustere, diagrame fază, conformaţie, de coordonare, şi aşa mai departe.

 

Cifre 10-11 de mai jos arată modul în care metalele şi non-metale sunt manipulate în stratul de abordat fiind utilizat:

 

 

 

Figura 10 Ichi de bază non-metal strat

 

 

 

Fier Layer
Obligatiuni to Metals

      Toate obligaţiuni pentru metale

   Ignoraţi de tip bond

 

      Gol dacă nu obligaţiuni la metale

 

      Utilizaţi atunci când lipirea este cunoscut şi semnificativ

 

Figura 11 strat de metal Ichi

 

 

În zona de stereochimia algoritmului Ichi în prezent se ocupă de legături duble şi tetraedrice (SP3), geometria sunt prezentate în figura 12.

 

 

 

 

 

Figura 12 stereochimie în Ichi

 

 

 

Tautomers, de asemenea, manevrate de Ichi, dar nu vor fi discutate în acest raport.

 

 

 

Ichi de ieşire

 

 

 

 

 

 

Ichi de ieşire
nouă posibile domenii

       De bază non-metalice # #

    Metal # #

    Izotopice # #

Stereo # #

    Stereo # #

 

       Tautomer non-metalice # #

    Metal # #

    Izotopice # #

Stereo # #

    Stereo # #

       Electronic # #

 

Figura 13 Nouă posibil Ichi de ieşire domenii

 

Proiectul actual Ichi câmpurile de ieşire sunt prezentate în Figura 13, cu un exemplu real de benzen prezentate mai jos în Figura 14.

 

 

 

 

Figura 14 Exemplu de ieşire proiectului Ichi pentru benzen

 

 

Algoritmul de testare

 

Algoritmul Ichi a fost testat extensiv. Peste 100 de copii ale versiunii mai bun test au fost difuzate în ultimele 18 luni, iar feedback-ul, în timp ce, în general, rare, a fost utilă. nr defectele nu au fost încă transformat în sus, chiar şi atunci când structuri foarte complexe, cum ar fi prezentate în figurile 15 şi 16 au fost testate (13). Viteza de algoritm este excelent, cu structuri tipice iau mai putin de 2 milisecunde pe o viteză medie (1 GHz) PC.

 

 


 

 


Figura 15 Exemplu de o moleculă mare complex gestionate de către algoritmul Ichi


 

 

 


Figura 16 Exemplu de o moleculă complex extrem de mare şi simetric gestionate de algoritmul Ichi

 

 

 

 

 

Rezumat

 

Într-o scurtă perioadă de aproximativ 3 ani, IUPAC Ichi proiectul a trecut de la concepţie până la testarea unui algoritm bine dezvoltat în aplicare domeniu public pentru reprezentarea standard structura chimică. multă muncă tehnice rămâne de făcut. Chiar mai important este nevoia de acceptare a algoritmului. Până în prezent răspunsul din partea organizaţiilor de baze de date şi companii de software care produc programe de structura de desen a fost mai încurajatoare. O versiune iniţială de lucru care acoperă structurile de bază chimice organice pentru uz public este de aşteptat până la sfârşitul anului 2003. Lucrări pe o acoperire de clase suplimentare de produse chimice continuă şi un raport de progrese suplimentare vor fi luate pe viitor in urmatoarele 12-18 luni.

 

 

 

Referinte:

 

 

1. http://www.iupac.org/organ/ad_hoc_cmt/nomenclature/NRT_Report.html

 

2. Bill Town, Kilmorie Consulting, 24A Elsinore Road, London SE23 2SL,
Marea Britanie, E-mail: bill.town @ kilmorie.com

3. John M. Barnard, Reprezentanţa Structura, capitol, în Enciclopedia de Chimie Computaţională, 5 volum Set Paul von Ragu Schleyer (Editor-in-şef),
ISBN: 0-471 - 96588-X,
John Wiley, 1999.

 

4. Proiectul a fost anunţat oficial în chimie International, Volume 23, Number 3, mai 2001: http://www.iupac.org/publications/ci/2001/may/project_2000-025-1-050.html

 

5. IUPAC informaţii Ichi proiect este disponibil la adresa: http://www.iupac.org/projects/2000/2000-025-1-800.html

 

6. Alan McNaught, Societatii Regale de Chimie, Thomas Graham Casa, Parcul Ştiinţă, Milton Road, Cambridge 0WF CB4, Marea Britanie, e-mail: adm@rsc.org

 

7.P. Murray-Rust şi HS Rzepa, în capitolul "Manualul de Chemoinformatics. Partea 2 Subiecte avansate..", Ed. J. Gasteiger şi T. Engel, 2003, în presă.

 

8. Diapozitive din aceste două prezentări sunt disponibile la: http://www.hellers.com/steve/pub-talks/

 

9. Ce este într-un Nume ChemWeb Alchimistul, douăzeci şi unu martie 2002. Disponibil la: http://www.chemweb.com/alchem/articles/1015947151360.html

 

 

 

10. Acest sentiment Ichi, ChemWeb Alchimistul, 24 aprilie 2002. Disponibil la: http://www.chemweb.com/alchem/articles/1015947904091.html

 

11. David Adam , Chimistilor sinteza unui singur sistem de Naming Nature 417, 369 (23 mai 2002)

 

12. Michael Freemantle, etichete unice pentru compuşi, C & E articol de ştiri: 02 decembrie 2002. De asemenea, disponibile pe internet la adresa: http://pubs.acs.org/cen/today/nov26.html

 

13. Mathon, R. Grafice de propoziţii pentru Izomorfismul a efectuat testele Congressus Numerantium V21, pp. 499-517, 1978

Published (Last edited): 05-12-2011