Thursday, October 31, 2013

Everyone, SMILES!

OK, so today we're going to learn about Simplified molecular-input line-entry system, but since this title is already too long and I'm afraid you won't read any further dreading how long the post will be. So here's the good news. We're changing the title to SMILES. Short, simple, and sort of...fun. I guess.

But unfortunately, we're not smiling to each other here. Of course the main reason is I will never now if you actually will smile, but actually:

SMILES is a specification in form of a line notation for describing the structure of chemical molecules using short ASCII strings”.

In other words, it’s the way we type the notation of chemical molecules using a this SMILES system. Since it’s in ASCII strings, it can be imported by most molecule editors for conversion back into two-dimensional drawings or three-dimensional models of the molecules. Convenience isn’t? This system is very widely used by academician worldwide.
Let’s see two types of SMILES:

Canonical SMILES  Isomeric SMILES
version that includes rules
for ensuring that each distinct
chemical molecule has a single unique SMILES representation
version that includes extensions to support the specification of isotopes,
chirality, and configuration about double bonds

Few characteristics:
We use certain letters to represent atoms
Hydrogens are removed, and cycles ane broken
Numeric suffix used between broken cycles
Parentheses used to indicate branching in the molecule tree
And these are the symbol for bonds...

Single bond -
Double bonds =
Triple bonds #
Aromatic *omitted

SMILES Charges

Specify attached hydrogens and charges in square brackets
Number of attached hydrogens is the symbol H followed by optional digit.

Further Restrictions

A branch cannot begin a SMILES notation - A branch cannot immediately follow a double- or triple-bond symbol-Example: C=(CC)C is invalid, butlC(=CC)C or C(CC)=C are valid SMILES

 

Disconnected Structures

Tetramethyl ammonium bromide  C[N+]C(C)C.[Br-]


Isomeric and Chiral SMILES

 l. Isomeric configuration indicated by forward and backward slashes: /  \
2. Examples:
trans-1,2-dibromoethene: Br/C=C/Br
cis-1,2-dibromoethene: Br/C=C\Br
3. Chirality indicated by the @” symbol

Take a look at some examples

Well how was that? Enough? You can see more here  SMILESCAS Database



No comments:

Post a Comment