<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2448.0">
<TITLE>RE: Unix/Java design issues (Was: Re: Is CDATA &quot;structure&quot;?)</TITLE>
</HEAD>
<BODY>
<UL>
<P><FONT SIZE=1 FACE="Arial">-----Original Message-----</FONT>
<BR><B><FONT SIZE=1 FACE="Arial">From:&nbsp;&nbsp;</FONT></B> <FONT SIZE=1 FACE="Arial">Hunter, David [SMTP:dhunter@Mobility.com]</FONT>
<BR><B><FONT SIZE=1 FACE="Arial">Sent:&nbsp;&nbsp;</FONT></B> <FONT SIZE=1 FACE="Arial">Wednesday, July 21, 1999 12:48 PM</FONT>
<BR><B><FONT SIZE=1 FACE="Arial">To:&nbsp;&nbsp;&nbsp;&nbsp;</FONT></B> <FONT SIZE=1 FACE="Arial">xml-dev@ic.ac.uk</FONT>
<BR><B><FONT SIZE=1 FACE="Arial">Subject:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</FONT></B> <FONT SIZE=1 FACE="Arial">RE: Unix/Java design issues (Was: Re: Is CDATA &quot;structure&quot;?)</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">Windows NT is perfectly Unicode aware, and I routinely view XML documents in</FONT>
<BR><FONT SIZE=2 FACE="Courier New">Notepad on my NT box.&nbsp; All of the characters are fine, with the only problem</FONT>
<BR><FONT SIZE=2 FACE="Courier New">being the LF-CRLF-CR problem that started this thread in the first place.&nbsp; I</FONT>
<BR><FONT SIZE=2 FACE="Courier New">am 87% sure that Windows 95 uses the windows-1250 or windows-1252 character</FONT>
<BR><FONT SIZE=2 FACE="Courier New">set internally, although it may also have some level of Unicode awareness.</FONT>
<BR><FONT SIZE=2 FACE="Courier New">(I'm not sure about that.)&nbsp; And I haven't the faintest idea what character</FONT>
<BR><FONT SIZE=2 FACE="Courier New">set Windows 98 uses natively, although I'd like to hope that it's Unicode.</FONT>
</P>

<P><FONT COLOR="#0000FF" SIZE=2 FACE="Arial">Windows 98 is like Windows 95, but here is the kicker -- both can convert from the codepage that they are setup with to/from unicode.&nbsp; This is significant because COM on Win9x as well as NT is *ALL* unicode internally (thus, MS's DOM (being a COM object) does everything internally in unicode all the time (although I must plead ignorance as to its usage of the LF-CRLF-CR thing that this thread is about).</FONT></P>
</UL>
<P><FONT SIZE=2 FACE="Tahoma">Blair L. Murri</FONT>
<BR><FONT SIZE=2 FACE="Tahoma">Sr. Programmer/etc.</FONT>
<BR><FONT SIZE=2 FACE="Tahoma">WavePhore, Inc.</FONT>
</P>

</BODY>
</HTML>