Developers: ISO Standards Do Matter

A post by Michael DeHaan and others inspired me to say a few words about the importance of ISO standards for developers:

Many developers are clamming that good specifications are more important than standards, specially now that the OOXML process opened to the public the dungeons of ISO processes and how the organization produces standards. This is a clear example on how ISO’s reputation is compromised.

But unfortunately “ISO standards” are what governments tend to use. These are the words they put in their Request For Proposals when they are going to buy things. These “ISO standards” are the words they use to claim how they’ll interoperate and trade across borders. And also how public institutions will interoperate with private institutions. Over time, it defines also how private institutions use technology.

So yes, ISO standards for Information Technology do matter from a developer standpoint because they are crucial in shaping the flow of information in the society in general.

Lets put it this way: technical specifications stand for research and development team while to be an ISO standard equals to have a strong sales force. An IT product needs both to succeed.

So you, developer, can use whatever you want or like. But if you want to interoperate with non-developer folks, you — the smartest guy in this context — will have to use what non-developers use, and they use what has a stronger marketing force as “this is an ISO standard”. This is why ISO standards (good or bad) should be in the focus of our attention.

Since the world already has an International Standards Organization, and since we learned it must be patched, it is our responsability — we, the developers, geeks, sysadmins etc — to be aware of and get involved with what ISO is standardizing right now and help the technical process of standardization to happen solely with technical arguments and not political interests.

Otherwise the future world will still be divided in two groups of developers: those that develop with/for good stuff and those that develop with/for stuff used by non-developers just because a powerful company had the strength to standardize it whatever it takes.

Índice Linux Journal, Março de 2008

  1. Porcentagem de usuários que clicam em propagandas pelo menos uma vez por mês: 1
  2. Número de vezes por mês que tais usuários clicam em propagandas: 1
  3. De cada três pessoas que clicam em propaganda, o número de mulheres: 2
  4. Bilhões de dólares americanos projetados em 2008 em vendas de propaganda: 486
  5. Bilhões de dólares americanos projetados em 2008 em vendas de propaganda on-line: 44.6
  6. Porcentagem do mercado projetado para 2008 referente a propaganda on-line: 9.4
  7. Anos necessários para que propaganda on-line ultrapasse propaganda em rádio: 0
  8. Anos necessários para que propaganda on-line ultrapasse propaganda em revista: 2
  9. Linhas de código buscadas por Koders.com: 766,893,913
  10. Linhas de código buscadas por KruglePublic, em bilhões: 2.6
  11. Repositórios de código buscados por Krugle.com: 600
  12. Milhares de projetos buscados por KruglePublic: 100
  13. Número de projetos registrado em SourceForge: 164,138
  14. Número de usuários registrado em SourceForge: 1,744,635
  15. Serviços listados no Sourceforge Marketplace em seu lançamento: 600
  16. Milhões de celulares baseados em Linux vendidos pela Motorola: 9
  17. Porcentagem do portfólio de celulares da Motoroal servidos pela plataforma Linux MotoMagx da companhia: 60
  18. Porcentagem de CPUs Linux rodando AMD Athlon: 14.71
  19. Porcentagem de CPUs Linux rodando Pentium 4: 12.15
  20. Porcentagem de CPUs Linux rodando outros Pentiums: 24.97

Fontes

  • 1–3: AOL
  • 4–8: AdAge
  • 9: Koders.com
  • 10–12: Krugle.com
  • 13, 14: SourceForge.net
  • 15: CNN.com
  • 16, 17: AmericasNetwork.com
  • 18–20: Linux Counter (counter.li.org); numbers gathered by December 9, 2007

Por Doc Searls. Original: http://www.linuxjournal.com/article/9976#mpart1

Índice Linux Journal, Fevereiro de 2008

  1. Número de processadores x86 necessários para executar a mesma quantidade de trabalho de um mainframe IBM System z: 250
  2. Consumo de energia de um mainframe zSeries como uma porcentagem daquela necessária por 250 x86 processadores: 2
  3. Porcentagem de todos os servidores físicos que serão virtualizados em 2011: 50
  4. Número de parceiros no Google Open Handset Alliance para sua plataforma de telefone baseada em Linux, Android: 30
  5. Número de funcionários do Google trabalhando na iniciativa Android: 100
  6. Milhões de telefones móveis vendidos mundialmente no 3° trimestre de 2007: 289
  7. Bilhões de dólares mínimo que o Google vai oferecer no leilão do espectro americano de 700MHz: 4.6
  8. Número de fabricantes de motores de locomotivas que se deram bem no negócio de motores a disel: 0
  9. Bilhões de linhas telefônicas no mundo: 4
  10. Bilhões de contas de telefone móvel: 2.68
  11. Milhões entregas de dispositivos habilitados para Bluetooth em 2007: 800
  12. Bilhões de telefones Nokia em uso: 900
  13. Idade da Nokia como uma companhia: 142
  14. Bilhões que a Nokia está gastando para se tornar uma “consumer Web media company”: 9
  15. Bilhões de telefones móveis que serão vendidos em 2008: 1.3
  16. Porcentagem de telefones móveis que serão vendidos em 2008 na Asia/Pacífico: 82
  17. Porcentagem de Linux entre as top 10 companhias de hosting mais confiáveis segundo a Netcraft em setembro de 2007: 50
  18. Porcentagem de Linux entre as top 3 companhias de hosting mais confiáveis segundo a Netcraft em setembro de 2007: 100
  19. Porcentagem de Linux entre as top 48 companhias de hosting mais confiáveis segundo a Netcraft em setembro de 2007: 43.75
  20. Porcentagem das top 48 companhias de hosting mais confiáveis que são Linux, FreeBSD, Solaris ou F5 Big-IP (BSD-based) em setembro de 2007: 66.7

Fontes

  • 1, 2: IBM and its Power Estimator Tool, CNN
  • 3: IDC, via Guardian.co.uk
  • 4: The Register
  • 5–7, 12–16: Forbes
  • 8: Bob Frankston
  • 9, 10: Trends in Telecommunication Reform 2007, from the ITU, via Dilanchian.com.au
  • 11: Laptop Magazine
  • 17–20: Netcraft.com

Por Doc Searls. Original: http://www.linuxjournal.com/article/9943#mpart1

FISL 2008 e Open Source na IBM

Algumas pessoas andaram me perguntando por que a IBM não está participando do FISL 2008.

Percebia em seu tom de voz (ou nas linhas do Jabber/Google Talk) que na verdade perguntavam se a IBM está parando de suportar Open Source. Não está.

Open Computing

A IBM continua a suportar Linux, Open Source e Padrões Abertos de forma absolutamente central.

Muitos dos produtos mais estratégicos da IBM tem elementos Open Source em seu núcleo, como o Eclipse, Apache, diversas bibliotecas etc. Além do mais, Linux ocupa um papel fundamental como plataforma operacional para uma série de iniciativas de Cloud Computing, Grid, Web Services etc.

Linux é inclusive a plataforma sugerida, sempre que possível, na implementação de soluções em clientes.

Open Source versus Proprietary Software

Sem usar meu chapéu da empresa, minha opinião é que a IBM tem uma estratégia muito bem balanceada sobre como usar e integrar Open Source. Muita inovação ainda acontece no universo do software de código fonte fechado e não há porque não explorar isso comercialmente. Mas é muito claro dentro da empresa que Open Source está deixando de ser algo somente para a infraestrutura e vem avançando no middleware e níveis acima também. Isto é muito be visto como uma rota natural da indústria de software. E se por acaso a IBM demonstra uma resistência ou outra quando algum Open Source passa a concorrer diretamente com um de nossos produtos, isso é só um reflexo do instinto de preservação que em seguida abre espaço para adaptação.

A IBM este ano não está participando do FISL por uma questão tática temporária interna. Alguns grupos mudaram, pessoas se movimentaram (como acontece em todas as empresas) e simplesmente não deu tempo. Só isso.

Mas ficou uma vontade enorme de ir.

Profissões Web 2.0

Em 2007 participei de uma série de reuniões com clientes e discussões sobre a importância do Second Life na estratégia de qualquer pessoa ou empresa que se julgue “in”.

Veja, não estou dizendo que o Second Life é importante, mas que muitas pessoas e empresas chegaram a discutir isso seriamente.

Levante a mão quem já entrou no Second Life. Agora levante a mão quem entrou mais de uma vez e continua usando.

A Sociedade da Informação de hoje não esta pronta nem tecnológica nem psicologicamente para esses mundos virtuais. Mas eles nos ensinaram uma lição: muito relacionamento humano está acontecendo em forma de fluxo de bits, e as empresas querem estar onde as pessoas [seus clientes] estão.

O Second Life (e similares) é a manifestação máxima dessa malha digital de relacionamentos (também conhecida como Web 2.0), mas se é ainda inusável, que tal as empresas clarearem seus objetivos – estar perto das pessoas, lembra? – e usarem outras ferramentas da mesma família para atingí-los?

Que tal criarem blogs corporativos para se comunicarem de forma mais direta, descontraida e interativa com seus clientes, como a IBM, Sun, Intel, Google, Microsoft, Nokia tem feito ?

Que tal aumentarem sua participação em comunidades onde as pessoas estão, como Orkut, Facebook etc? Essas festas online, especificamente, são um prato cheio para fabricantes de produtos de uso final. E não estou falando de spam, mas de uma participação oficial que realmente agregue valor.

Que tal usarem conceitos de Wikinomics a fim de criar novos produtos baseado diretamente no desejo do consumidor ?

Agências de propaganda que tiverem afinidade com essas novas características da Sociedade da Informação poderão levar seus clientes a graus de competitividade mais confortáveis.

Profissões como Gerente de Redes Sociais, Blogueiro Corporativo, Evangelizador Digital estão surgindo no horizonte, são profissionais raros e que começam a ser procurados pelas empresas.

Esse profissional precisa de alguns ingredientes bem apimentados: capacidade de comunicação, bom conhecimento dos produtos da empresa, entender como redes sociais digitais funcionam, seus códigos de ética etc, alguns conhecimentos do linguajar dessa nova esfera (feeds, podcasts, trackbacks, avatars, OpenIDs etc) para fazer a tecnologia efetivamente trabalhar a seu favor, noções de user-friendlyness, etc. Meio técnico, meio comunicador, meio designer, meio webguy. Uma mistura bastante peculiar de características.

E como se trata de comunicação externa, há um certo risco e medo envolvido. “Será que meu blogueiro vai falar o que não deve, revelar segredos, etc?”.

Posso contar como isso aconteceu aqui na IBM. Há anos foram criados blogs, wikis e outras ferramentas típicas da Web 2.0 na Intranet. Todo funcionário pode ter seu blog interno, pode criar um wiki, etiquetar sites e pessoas, e automaticamente tem um perfil online tipo Orkut, que chamamos de Bluepages. Há também uma atmosfera e incentivo quase que formal para fomentar inovação, mas isso é outra história.

Alguns funcionários que começaram a blogar internamente passaram a fazer isso para a Internet. Houve uma espécie de seleção natural dos escritores.

O curioso é que essas ferramentas internas não foram criadas para fazer tal seleção. Mas seu uso é tão marcante no dia a dia dos funcionários que elas até viraram produtos para empresas que querem criar sua infraestrutura para a Web 2.0 sem o uso das ótimas opções em Software Livre que existem por aí.

Mas voltando às profissões, o mais interessante é que não há curso universitário que forme para tal missão. Pense nisso.

Upgrade to WordPress 2.5

This is my first post in the new WordPress 2.5.

Upgrade was as easy as:

$ cd avi.alkalay.net
$ svn sw http://svn.automattic.com/wordpress/tags/2.5/

Everything worked without any changes, including my experimental content-optimized Plasma theme.

The new WordPress has lots of improvements, specially in the administration part and I recommend it.

OOXML: Open Letter to YES-voting and ABSTAIN-voting Countries

I am learning a lot from all this standardization process.

I was a member of the brazilian committee and I also analyzed the specification. My country disapproved OOXML and I think this was a decision based on logic lead by the process.

The JTC1 rules page 49 item 9.8 says:

NBs may reply in one of the following ways:

  • Approval of the technical content of the DIS as presented (editorial or other comments may be appended);
  • Disapproval of the DIS (or DAM) for technical reasons to be stated, with proposals for changes that would make the document acceptable (acceptance of these proposals shall be referred to the NB concerned for confirmation that the vote can be changed to approval);
  • Abstention (see 9.1.2).

[Note: Conditional approval should be submitted as a disapproval vote.]

In other words, from my understanding, if there is one or more technical problems, the NB must disapprove the DIS. Many countries found many technical problems in OOXML that are still unresolved even after the BRM.

I also understand that such an important matter as an International Standard for Office Documents can’t be defined by 10 or 30 opinions collected as votes in a committee. Thats why the JTC1 process above talks about technical content, not opinion or vote. What I learned from studying the OOXML specification is that it is not ready for acceptance since many countries have found and reached consensus that the spec has problems, even after the BRM. If the NB-leveraged technical team — formed by people that would vote YES and NO — has produced a list of submitted problems in the spec, this list is by itself the consensus that the spec is still problematic.

I would like to understand why an NB that has produced technical comments voted YES or ABSTAINED. I thought abstention is a position for countries that were not able to create a committee to technically discuss the specification for reasons such as logistics or lack of quorum.

I am learning about all this and I’d like to have more solid arguments to build an opinion about these NB’s maturity to run a well documented process.

OOXML: Venezuela changed vote from YES to NO

Check it out:

From: “***FONDONORMA***” <in*&%@fondonorma.org.ve>
To: <ki*%$#@itscj.ipsj.or.jp>, <br*%$#%@iso.org>, <tak*%$#%@iso.org>, <ga*%$#%@iso.org>, “Maria Teresa Saccucci” <mar*%$#%@fondonorma.org.ve>, “Norma Arias” <norm*%$#%@fondonorma.org.ve>, “***FONDONORMA***” <in*%$#%@fondonorma.org.ve>
Date: Fri, 28 Mar 2008 14:04:26 -0430
Subject: Modification to the vote on DIS 29500 – Venezuela (FONDONORMA)
Toshiko Kimura
Secretary ISO/IEC JTC 1/SC 34

Att.: Mr. Keith Brannon, Mr. Maho Takahashi, Ms. Martine Gaillen

Dear Mr. Kimura,

Attached please find a letter from Mrs. María Teresa Saccucci, Standardization Manager of FONDONORMA (Venezuela) through which Venezuela wishes to modify its position on DIS 29500, Information technology – Office Open XML file formats from “Approval with comments” to “Disapproval with comments”.

Best regards,

Leonardo Di Bartolo
Coordinator of International Relations
FONDONORMA
Venezuela

This NO was a result of a very difficult meeting. Consensus was not reached and a lot of confusion happened. Exactly as in the first brazilian NO.

The NB had to decide the final vote based on technical issues still open in OOXML. The problem was the method of deciding and those technical points were not presented. So people only had in their head the Microsoft arguments that I already knew were part half trues and part complete lies.

I participated in the OOXML process in 3 countries and I was able to build an opinion on how normalization happens today in the world, and I’ll show some ideas in a future post.

By the way, this is how Caracas looks like, a city surrounded by huge green mountains that have behind them the Caribbean Sea.

Caracas from the EuroBuilding hotel

Caracas and the Caribbean Ocean in the map
Caracas from the EuroBuilding hotel

OOXML’s BRM: A flow of dirt

Finally Jomar, one of the brazilian delegate that went to OOXML’s BRM in Geneva has started to tell all the dirty little details of what really happened in that meeting and the surreal modus operandi of how 120 people can discuss 1027 issues in 5 days. Have fun in english and portuguese.

Oh, and talking about dirty playing, check the domain www.DocumentFreedomDay.com but remember that the original one is www.DocumentFreedom.org. The first one really deserves a DDoS attack.

OOXML: Brazil Says NO. Again.

It is now official. Brazilian vote was decided by consensus of the entire technical team, including Microsoft crew’s: OOXML does not deserve to be an international ISO standard.

Our first vote, in august, was also NO, due to the same reasons: OOXML is an awful specification.

That outcome was expected because we simply followed the process: technically analyze the OOXML specification, make comments, wait for responses, analyze them and see if all problems were fixed. Is there any single remaining unresolved problem? Vote NO. And in fact there were many many unresolved problems.

If every country followed this simple process, OOXML would receive a NO from 100% of them.

But in some countries, how is the process? Invite a few companies and simply count their votes. The problem here: 10, 20 or 80 votes can never represent what is the best for that country. Only, maybe, if you collect one vote for each citizen.

What I am trying to say is that in this case a decision must be reached by technical consensus, not vote. It is not a matter of will, but a technical issue that can only be reached by rational analysis and deliberation.

In Chile for example, 21 voting companies will define a 15 million people country vote in ISO. How easy is to lobby these 21 companies with Power Point presentations telling complete plain lies ?

Technically speaking, if your country’s vote was YES or ABSTENTION, one of these possibilities happened:

  1. Nobody had time to analyze the OOXML specification and the ABSTENTION was the right choice.
  2. Nobody had time to analyze the OOXML specification and a few people decided for you to vote YES, based on ideology or a result of lobby, not technology benefits.
  3. Even having time to analyze the OOXML specification, a few people decided for you to vote YES, based on ideology or result of lobby, not technology benefits.

Seems stupid, but these are exactly the 2 possibilities of OOXML getting YES votes in ISO. It is still an awful specification.

By the way, Brazil would vote NO again and again and again even if all OOXML’s technical issues could be resolved. OOXML would still have legal issues and also serious overlap problems with the OpenDocument Format ISO standard.

I was not present in today’s meeting in ABNT because I already knew what would be the result, since the process of analysis and deliberation in Brazil was very strictly followed. Hopefully Jomar will write about it and you can check more details.

Open Source Software inside the iPhone

Can Open Source Software be more ubiquitous than this ?

A few days ago I was playing extensively with Apple’s iPhone, investigating each sub-menu and little details. There is a section listing legal stuff and software being used with each license. GPL, LGPL, BSD and other Open Source licensed software rule the iPhone.

Some I have noted:

Microsoft sells Intra-operability as Interoperability

Interoperability

This is real Interoperability

  • Technical specifications for global interoperability and freedom
  • Interoperate through standards
  • Software product is less important
  • Switch products and keep access

Microsoft started their so called “interoperability” initiative. With a deeper look we find that the main objective of the released specifications is to let developers interact with their products only, something I like to call Intra-operability.

Intraoperability

This is Intraoperability

  • Technical specifications for interaction with and favor the product
  • Interoperate through the product
  • Software product is the main player
  • Switch product and loose access

See the difference?

Microsoft technical specifications have serious technical and legal issues, and are being released not to increase interoperability across people, organizations and applications, but to leverage the use of their products. For the standard document format scenario: OOXML is about allowing other people to interact with files that are primarily generated and manipulated with Microsoft Office. It is not about full interoperability, which would enable competition with Microsoft Office, for obvious reason.

For each purpose or scope, better open standards exist and should be adopted and used instead: Java versus .NET, XHTML versus IE-campatible-only DHTML, ODF versus OOXML, etc

My friend Cezar Taurion has also written some words about Intra-operability (in portuguese). Bob Sutor also put together some words about it.

These graphics are available in a friendly Creative Commons license, in this animated ODF file, in case you want to integrate them in your presentations. PDF export also available.

How Microsoft raped ISO

One of the most critical and discussed points of the whole OOXML subject is how the specification lets you include binary proprietary information.

Let me show you how it happens with a piece of an OOXML document, the red-marked text is the problematic part (see for yourself, §6.2.2.14, paper page 4,813, lines 7–13):

<v:shape>
<o:ink i="AMgFHQSWC+YFASAAaAwAAAAAAMA..." annotation="t" contentType="application/x-ms-ink"/>
</v:shape>

So you, as a programmer, please tell me what to do if you are developing an application that must read and generate this kind of document. How can I find documentation about this encoded binary stream? Is this a good practice in XML? Anyway, this kind of (bad) design appears in many parts of the OOXML spec. Want more examples of bad design? Have fun.

Suppose I really want to develop this kind of support in my application, I am a master programmer and reverse-engineered a few examples generated with a copy of MS Office 2007 that I had to buy. Or maybe I just found the specification of this proprietary application/x-ms-ink type and go to develop a library to handle it.

Inevitably, my library will reimplement aspects of some Microsoft library with same functionality, and according to a Software Freedom Law Center report, the Microsoft Open Specification Promise (OSP, basically the not-open-enough license Microsoft lawyers wrote for the usage and implementation of OOXML) cover’s the specification only, not code.

I will be sued for patent infringement. On software rewrite, not on specification usage.

Then the rape begins. Microsoft is claiming that this was solved in the ISO’s BRM meeting. This is the solution, from the ridiculous 12 pages resolutions, page 7:

Resolution 25: The BRM decides to accept the editing instructions contained in http://www.itscj.ipsj.or.jp/sc34/def/BRM/Response_0135_bitfields.doc in place of R 135, replacing “deprecated” by “transitional”, and with the following addition: The Editor shall ensure that all existing attributes defining the bitfields described above shall be “transitional”—so resolved.

Who reads this resolution with high level eyes may think that all binary fields will be removed from the specification. But please, you, as a programmer, tell me how the so called Editor will find all and every single part of a 6000+ pages specification containing bitfields? How he’ll expand all those bitfields in an XML subspecification? Will he invent some? Is he the right person (or team) to do that?

When done and if done, the specification will be something completely new, full of new parts. Will jump from 6063 pages to maybe 7500. Oh, and did I mention it will be something that even MS Office 2007 or 2008 don’t support today? Supporting or not, implemented or not, this new unexistent specification is the “thing” that countries’ National Bodies are voting right now, without even seeing it, without checking if it was corrected, without having time for this because they didn’t receive it for revision.

They won’t have time to review 6000+ pages because the deadlines defined by the ISO’s Fast Track process are over.

So the question is how ISO/IEC and JTC1 let such a big and problematic specification enter the light Fast Track process? My answare: ISO was raped.

I’ve been talking to several people that will define their country’s vote and their mindset is “are you really putting ISO in such a bad position?” Well, yes. You know, in the end ISO is not god. They are a bunch of people that, like you and me, have religions, aspirations, problems, family, go to the bathroom etc. Like you and me, they may be also naive in regard to some subjects, particularly document formats. Then comes Microsoft excellent speakers showing PowerPoint charts that are plain lies (e.g. “OpenOffice.org supports OOXML”) and people believes them.

People have two choices: to question ISO’s reputation in the OOXML case, or question IBM, Sun, Oracle, Red Hat, Free Software Law Center, ODF Alliance and many other institutions’ reputation when they massively scream in chorus that OOXML has serious technical, legal and standardization process issues.

This is a world where organizations like ECMA has completely lost the respect of the technical community. But this is not a big problem, because we have other similar, still reliable bodies as OASIS, W3C, OSF, etc.

This is a world where we will have to work hard to make ISO regain its (currently damaged) reliable status. This is a big problem, because we only have one (and only need one) International Standards Organization.

This is your responsibility. To start this work get involved with your country’s National Body for standardization and promote the creation of a formal letter to ISO about the OOXML process, its problems and how ISO let that happen. INCITS in USA, ABNT in Brazil, INN in Chile etc.

OOXML in Numbers

This is a numerical photography of what is the Microsoft Office Open XML wannabe specification:

  • 6063 pages written in 12 months
  • Only 6 months of analysis pointed 3500 issues that span from intellectual property, to standard date & time representation, to malformed XML definitions, to binary proprietary bits
  • 3500 issues where summarized in “only” 1027
  • ECMA proposed 2293 pages of mutually conflicting changes to make happy those 3500 comments
  • Only 30 days to analyze those 6063+2293 pages against those 3500 comments
  • Only 5 days of BRM to discuss 6063+2293 pages
  • Only 18% of these 1027 problems where discussed in BRM
  • 82% of problems were not even discussed
  • BRM produced a short 12 pages document containing alterations to those 6063 pages long spec based on 2293+thousands of pages of comments from all countries+19 months of technical writing and global analysis work. By the way, those short 12 pages propose such nebulous alterations — as Resolution 25 on page 7 — that it is difficult to foretell how they will technically fit in the new specification. If applied, those alterations could turn the original spec upside down, so deeply that it could become a completely new specification, maybe even worse than the first one.
  • Now countries must vote if they approve or not this still unfinished new OOXML that will be divided in 4 independent parts for strict conformance class+4 parts for transitional (deprecated) conformance class. These final multipart wannabe standards don’t exist yet and will be released about the same day countries will have to vote for it.

Or graphically:

History and confusion of OOXML

And you still think OOXML is ready to become an International Standard Format for storing YOUR documents ?

Come on, give me a break !

OOXML na ISO e os números que na verdade não existem

Li algumas coisas na Internet sobre o resultado final do BRM. Em alguns lugares encontrei números e interpretações das mais diversas sobre estes resultados. Como faço parte do comitê da ABNT que analisou o OOXML, resolvi conversar com o Jomar, que foi um dos delegados brasileiros em Genebra.

Ele me disse que não pode comentar nada sobre estes números e sobre o resultado, pois no último dia do BRM, a autoridade da ISO lá presente alertou a todos que nenhum número deveria deixar a sala de reuniões, pois sem conhecer os processos de decisão lá adotados, nenhum número ou estatística faz sentido.

Avisou ainda que qualquer divulgação ou utilização marketeira destes números é no mínimo irresponsável e segundo o entendimento dele uma
clara violação das regras estabelecidas (mas aliás… alguma regra foi seguinda neste processo todo ?).

Eu tentei insistir com o assunto (e olha que o cara é meu amigo), mas ele se recusou a me dar mais informações. Me pediu apenas para entrar em contato com quem divulgou as informações e pedir a ele os devidos esclarecimentos (incluíndo os critérios e regras de votação).

Como eu sou insistente mesmo, acabei arrancando pelo menos uma explicação metafórica dele:

“Se eu te disser que 85% da população mundial sobreviveu à II Guerra Mundial, você consegue concluir que esta guerra não foi tão ruim assim? Se não consegue é porquê conhece os detalhes do processo. Se consegue… vai ler os livros de história e estudar o processo e aproveite pois este episódio não teve uma “Lei do Silêncio” que obrigou todos os envolvidos a se calar. O BRM não vai ter “livro de história” para explicar a estatística.”.

Números são apenas números e marketing será sempre marketing (e o Jomar não abre a boca mesmo… que chato).

OOXML: Está rolando um barraco na ISO

Veja como as coisas são…

Segundo o post do Jomar que esteve no BRM da ISO, um cidadão chegou nele num intervalo e sutilmente pediu para que não levantasse uma questão importante no processo do OOXML da Microsoft virar ou não um padrão ISO: a inexistência do mapeamento entre o formato legado (ex: .doc) e o formato novo (ex: .docx).

Sem esse mapeamento, o propósito primordial da existência do OOXML como padrão ISO deixa de existir.

Só pra lembrar qual é o propósito do OOXML, extraido (em livre tradução) de sua especificação:

O objetivo deste padrão [OOXML] é […] representar fielmente o corpo de documentos existentes […]

Os tais “documentos existentes” são no caso todos os documentos em formato binário legado do MS Office (.doc, ,ppt, .xls), algo fora do escopo do OOXML.

Se esse mapeamento não fizer parte da especificação OOXML, seu objetivo primordial é inválido. A especificação é inválida. E a delegação brasileira queria levantar essa bola: cadê o mapeamento ?

Mas o barraco aqui é outro. Um cidadão pedir pra ele não levantar essa bola é uma coisa. Sei lá, tal cidadão deve ter razões políticas ou financeiras para querer ver uma especificação com sérios problemas conceituais [OOXML] virar um padrão internacional.

O que me escapa o entendimento é por que a ISO não deixou o Brasil apresentar esse questionamento ?

Só sei que a blogosfera vai desabar sobre esse assunto nos próximos dias e vou acompanhar de perto os blogs do Rob Weir, Bob Sutor, Andy Updegrove, Groklaw e a quantidade de reações que o post traduzido do Jomar recebe. Muitos desses blogs já estão descendo a lenha.

How to Make High Quality DVD Rips

Some friends asked so the following is how I encode (rip) DVDs.

Choosing the file format: .AVI, .OGG, .MP4 or .MKV ?

The ripped video file format is a decision you must make. Currently my format of choice is .MKV or Matroska. I’ll explain why.

It is quite silly to say that an .MP4 movie has better quality than a .AVI or vice-verse (or any other combination of comparisons). OGG, MP4 (MPEG-4 Part 14), MKV (Matroska), AVI, WMV (or ASF) are just containers, envelopes. Video quality depends on what goes inside it.

“Multimedia” has this name because you have multiple types of media: video in multiple angles, multiple audio options including different languages and channels (stereo, 5.1, 6 channels etc), subtitles in several languages, chapter information, menu etc. Think about a DVD. So this is a graphical view of how things are organized inside a 900MB movie file in a modern format as MKV or MP4:

Header with tags, track names, chapters info, seek positions Main Video track (MPEG-4 AVC/H.264) Attachments as JPG images, documents, scripts or text files
Video segment showing another angle (MPEG-4 ASP/Xvid/DivX)
Audio track: English Dolby Surround 5.1 (AC3)
Audio track: Director’s comments stereo (MP3)
Audio track: Portuguese Dolby Surround 5.1 (DTS)
Subtitle track: Portuguese (Unicode text)
Subtitle track: Chinese (Unicode text)
Subtitle track: English (VobSub)
byte 100K byte 100M byte 200M byte 310M byte 420M byte 530M byte 650M byte 780M byte 895M byte 900M

A digital multimedia file format must be capable to contain all this different medias and multiplex them in parallel so you won’t have the video in the first 500MB of the file and the audio on the following 500MB (this can’t work for streaming). And this is exactly what modern file formats as MP4 and MKV do: they carry all your movie-related data together.

This is a comparison of all these file formats based on my personal experience with them (a more formal comparison can be found in Wikipedia):

.MKV .MP4 .AVI
Industry support Almost none Good and increasing, specially on Apple platforms, the mobile scene and Nero Digital ecosystem Treated as legacy popular format
Usage on the web Very popular on HD or high quality DVD rips Very popular on HD or high quality DVD rips, supported by Flash Player, YouTube, Google Video Popular amongst low-quality DVD rips
Support for advanced video formats and multiple video angles Yes. MPEG-4 ASP (DivX, Xvid), MPEG-4 AVC (a.k.a. H.264) etc Yes. Only MPEG-4 systems and a few others Problematic and No
Support for multiple audio tracks (channels, formats, languages and “director’s comments”) Yes Yes. Formats are only MP3, AAC and a few others not very popular Yes
Support for tags (artist, title, composer, etc as MP3’s ID3) Yes Can be supported by MP4 extensibility but this is not very well standardized across authoring tools (iTunes, GPAC etc) and players (Amarok, Media Player Classic, iPod, Windows Media Player etc) No
Support for attachments with mime-types (used to attach movie posters images or other files) Yes No
Support for chapter marks Yes No
Support for multiple language embedded soft-subtitles Yes. VobSub (as extracted from DVDs), plain timed UTF-8 text (SRT, SUB) etc No
Support for naming tracks with human names as “Director’s comments” or “Portuguese subtitles” etc Yes Yes No
Support for carrying menus information (as in DVDs) and interaction Yes through an XML idiom, but unsupported by most players Yes through SVG, but unsupported by most players No
The container overhead in bytes in the final file Very small Very small Very big
Supported by free and Open Source multiplatform authoring tools Perfect on Linux, Unix, Windows and Mac Yes (see GPAC), with some intellectual property issues. Tools need to mature. Yes
Ready for popular web streaming as in Flash player No Yes. The popular Flash Player that is installed on everybody’s browser supports playing MP4 files as long as they contain H.264 video and AAC audio tracks. I recommend the LongTail FLV/MP4 Player since it also plays subtitles embedded in MP4 files. No

Personally I believe MP4 is the multimedia file format for the future because since it is getting popular, all these non–standardized features will get stabilized. MP4 is an ISO standard and the increasing industry support can be felt on iPods and portable devices, and most notable on home DVD players capable of playing the 700MB MP4 video file burned in a CD.

By the way, remember this:

  • MP4 is not an evolution of MP3. AAC (MPEG-4 Part 3) is.
  • MP5 and MP6 (used to classify portable media players) are things that simply doesn’t exist in the multimedia scene.
  • .M4A, .M4V, .MOV and .3GP files can safely be renamed to .MP4. They just use to be different extensions to help user’s eyes easily identify whats inside.

Meanwhile, MKV wins everything but on the Industry Support category. But this doesn’t really matter, and I’ll explain why. Since MKV is just a container, the large video, audio etc streams can be extracted and repackaged into MP4 and vice-versa in seconds. No transcoding (decoding followed by a lossy encoding into another format) is needed.

So today I store my videos in the most feature rich and well supported by players format: MKV.

OGG or OGM (the container file format) is practically dead in my opinion. They were created as part of the Xiph initiative for a complete open source patent-free multimedia framework, but seems nobody uses it anymore for video. From the same family, Vorbis (the audio codec compared to MP3, a.k.a. .OGG) is very good but also very not popular. Theora (the video codec) is frequently comparable to old MPEG-1 in terms of quality and compression ratio so currently, if you want quality and are not concerned about patents, MPEG-4 AVC is the best choice. FLAC, Xiph’s lossless audio codec, is the winner of the family: very popular, massively used, and recommended.

Encoding the DVD

I use HandBrake, the most practical Open Source (and overall) movie encoder. It runs on Linux, Mac and Windows and uses the same Open Source libraries as ffmpeg, mplayer/mencoder, xine, etc. While these programs are generic video handlers (with thousands of confusing configuration parameters to sustain this generalistic status) HandBrake is optimized only for ripping so it is very easy to use, yet extremely powerful.


#!/bin/bash

##
## This is the script I use to make hifi DVD rips including chapter markers and
## subtitles. It uses Handbrake.
## Contains what I found to be the best quality ripping parameters and
## also let me set simple parameters I need.
##
## Avi Alkalay <avi at unix dot sh>
## http://avi.alkalay.net/2008/03/mpeg4-dvd-rip.html
##
## $Id$
##

#set -vx

HANDBRAKE=${HANDBRAKE:=~/bin/HandBrakeCLI}
#HANDBRAKE=${HANDBRAKE:="/cygdrive/c/Program Files/Handbrake/HandBrakeCLI.exe"}
## Where is the Handrake encoder executable.
## Handbrake is the most practical free, OSS, DVD riper available.
## Download HandBrake for Linux, Mac or Windows at http://HandBrake.fr


INPUT=${INPUT:=/dev/dvd}
## What to process. Can also be a mounted DVD image or simply '/dev/dvd'


TITLE=${TITLE:=L}
## The title number to rip, or empty or "L" to get the longest title


#CHAPTERS=${CHAPTERS:=7}
## Example: 0 or undefined (all chapters), 7 (only chapter 7), 3-6 (chapters 3 to 6)


#VERBOSE=${VERBOSE:="yes"}
## Wether to be verbose while processing.


SIZE=${SIZE:=1200}
## Target file size in MB. The biggest the file size, the best the quality.
## I use to use from 1000MB to 1400MB for astonishing high quality H.264 rips.


OUTPUT=${OUTPUT:="/tmp/output.mkv"}
## Output file. This will also define the file format.
## MKV (Matroska) is currently the best but MP4 is also good.


AUDIO=${AUDIO:="-E ac3 -6 dpl2 -D 1"} # For AC3 passthru (copy).
#AUDIO=${AUDIO:="-E lame -B 160"} # For MP3 reencoding. Good when input is DTS.
## Audio parameters. If input is AC3, use it without transcoding.
## If is DTS, reencode to MP3.


MATRIX=${MATRIX:=`dirname $0`/eqm_avc_hr.cfg}
## x264 matrix to use. The matrix file may increase encoding speed and quality.
## This one is Sharktooth's as found
## at http://forum.doom9.org/showthread.php?t=96298

######### Do not change anything below this line ##############


## Make some calculations regarding title and chapters based on parameters.
SEGMENT=""
if [[ "$TITLE" == "L" || -z "$TITLE" ]]; then
	SEGMENT="-L"
else
	SEGMENT="-t $TITLE"
fi

[[ -n "$CHAPTERS" && "$CHAPTERS" -ne 0 ]] && SEGMENT+=" -c $CHAPTERS"

[[ "$VERBOSE" != "no" ]] && VERB="-v"



# Define args for the x264 encoder. These are some values I found on the net
# which give excelent results.
X264ARGS="ref=3:mixed-refs:bframes=6:b-pyramid=1:bime=1:b-rdo=1:weightb=1"
X264ARGS+=":analyse=all:8x8dct=1:subme=6:me=umh:merange=24:filter=-2,-2"
X264ARGS+=":ref=6:mixed-refs=1:trellis=1:no-fast-pskip=1"
X264ARGS+=":no-dct-decimate=1:direct=auto"
[[ -n "$MATRIX" ]] && X264ARGS+=":cqm=$MATRIX"


# Encode...
"$HANDBRAKE" $VERB -i "$INPUT" -o "$OUTPUT" \
	-S $SIZE \
	-m $SEGMENT \
	$AUDIO \
	-e x264 -2 -T -p \
	-x $X264ARGS


# Repackage to optimize file size, to include seek and to include this
# this script as a way to document the rip...
echo $OUTPUT | grep -qi ".mkv"
if [[ $? && -x `which mkvmerge` && -f $OUTPUT ]]; then
	mv $OUTPUT $OUTPUT.mkv
	mkvmerge -o $OUTPUT $OUTPUT.mkv \
		--attachment-name "The ripping script" \
		--attachment-description "How this movie was created from original DVD" \
		--attachment-mime-type application/x-sh \
		--attach-file $0

	[[ -f $OUTPUT ]] && rm $OUTPUT.mkv
fi

The script seems long because it is fully documented but it actually only collects some parameters and simply runs the HandBrake encoder like this (passed parameters are in red):


~/bin/HandBrakeCLI -v -i /dev/dvd -o /tmp/output.mkv \
    -S 1200 \
    -m -L \
    -E lame -B 160 \
    -e x264 -2 -T -p \
    -x ref=3:mixed-refs:bframes=6:b-pyramid=1:bime=1:b-rdo=1:weightb=1:analyse=all:8x8dct=1:subme=6:me=umh:merange=24:filter=-2,-2:ref=6:mixed-refs=1:trellis=1:no-fast-pskip=1:no-dct-decimate=1:direct=auto:cqm=~/src/randomscripts/videotools/eqm_avc_hr.cfg

All the rest is what I found to be the best encoding parameters.

The resulting video file (/tmp/output.mkv in this case) will contain correctly cropped video and audio quality as good as the DVD (it is almost lossless), and chapter breaks at the same positions read from the DVD.

In a Core Duo machine as my laptop running Fedora 8 or Windows XP, a 2 pass H.264 encoding (2 pass improves quality and H.264 is newer standard MPEG-4 technology better than DivX/Xvid) takes about 4 to 5 hours for a regular 2 hours movie, so leave it encoding while you go to sleep. A Pentium 4 machine running Ubuntu takes about 17 hours for the same rip.

I use to rip one chapter from the movie first (use your preferred video player or lsdvd command to find the shortest chapter), check quality, compare to DVD, fine tune, try again and then shoot full DVD ripping.

After encoding I use to repackage the audio/video stream with Matroska‘s mkvmerge (or mmg, its GUI version available on any Linux distribution as “mkvtoolnix” package, and installable for Windows or Mac OS from Matroska’s website) to optimize seeks and to include soft subtitles (that can be turned on and off as on regular DVDs), but I’ll explain that in another HOWTO.

Give Your Ripped Movie a Descriptive File Name

I use to organize my media library in a standard way I invented for myself and which I suggest you to use too.

My movie file names shows everything that the file includes. Some examples:

  • Indiana_Jones_and_The_Raiders_of_the_Lost_Ark_IMDB{tt0082971}-Xvid{720x304_23.98fps}+MP3{ENG,POB_VBR}+Sub{ENG,SPA,POB}+Covers.mkv
    This is the Indiana Jone’s Raiders of the Lost Ark movie, whose IMDB index is tt0082971 (IMDB{tt0082971}). It was ripped with the old Xvid codec and contains 720×304 pixels frame size at a rate of 23.98 frames per second (Xvid{720x304_23.98fps}). It also contains selectable audio tracks in English and Brazilian Portuguese encoded in variable bit rate MP3 (MP3{ENG,POB_VBR}). In addition, there is also selectable subtitles in English, Spanish and Brazilian Portuguese (Sub{ENG,SPA,POB}). The file also contains the cover images as attachments.
  • Harold_and_Maude_IMDB{tt0067185}-H264{672x368_3Pass_25fps}+HEAAC{EN}+Sub{POR,EN,FRE}+Chapters+Covers.mkv
    The old Harold and Maude movie whose IMDB index is tt0067185 (IMDB{tt0067185}). It is encoded with H.264 in 3 passes and has 672×368 pixels frame size at a rate of 25 frames per second (H264{672x368_3Pass_25fps}). There is only one English audio track encoded in modern HE-AAC (HEAAC{EN}). Subtitles in Portuguese, English and French (Sub{POR,EN,FRE}), chapter information and attached cover images. This is very complete high quality DVD backup.
  • I_Am_Legend_IMDB{tt0480249}-H264{704x304_23.98fps}+AC3{ENG_5.1}+Sub{POR}.mkv
    The I Am Legend movie whose IMDB index is tt0480249 (IMDB{tt0480249}), video encoded in H.264 with 704×304 pixels frame size (H264{704x304_23.98fps}), original 5.1 channels AC3 audio in English (AC3{ENG_5.1}) and subtitles in Portuguese (Sub{POR}).

The advantages of this scheme are:

  • It is web safe with no spaces in filenames. All underlines. It is also DOS safe.
  • To have the IMDB index let me know exactly which movie this file contains. This is particularly good to avoid ambiguity for movies that have remakes as Ben Hur, or movies that have an official name but are well known by other names or have international titles.
  • To know the encoding method, subtitles included and chapters info give me the overall quality of the movie right away.
  • Special attention to audio and subtitle languages. Having them on the filename let me know I will understand its content without having to play. Sometimes I can’t play the file because I logged in my home computer remotely.

Playing the Ripped File

To play this advanced Matroska media file that contains such a rich set of metainformation and highly compressed digital content you will need an advanced player too. And happens that the best players are the Open Source ones. So use these players:

These are Media Player Classic screenshots demonstrating how to activate the advanced content inside a Matroska file. Players on other platforms have similar capabilities and menus.

Activating embedded subtitles and languages
The player lets you choose the audio language and subtitles. On MPC for example, this is how you turn on and off and choose the language for subtitles.
Choosing subtitles language

As you can see, the player found subtitles embedded in the MKV file in English, Hebrew and Portuguese.

If the MKV file contains many audio tracks (as different languages, director’s comments etc) this is how to select it:

Selecting audio track to play in Media Player Classic

And to jump directly to a specific chapter on the movie, if the MKV file contains this kind of information:

Using Media Player Classic to browse chapter in a movie file

Improving audio volume
If you ripped the movie without reencoding the audio, the final file will contain DVD’s original AC3 audio tracks in 6 channels (5+1). This may sound with a lower volume when played in a 2-speaker system as your laptop, iPod, etc because 4 channels are simply not being played. To remediate this the player will have to downsample the audio. In other words, it will remix the 6 channels into 2 stereo channels while playing. The Media Player Classic options should look like this:

Selecting Media Player Classic\'s Audio Options

Configuring audio downsample on Media Player Classic

Primeiro dia de BRM do OOXML e Violência em Genebra

Não estou em Genebra, no Ballot Resolution Meeting do OOXML na ISO, mas falei pelo Google Talk com o Deivi do Serpro que é chefe da delegação brasileira, e em linhas gerais me contou o seguinte:

A delegação brasileira pediu para que eu tirasse as informações do ar para evitar problemas na ISO. O Jomar vai publicar algumas informações no blog dele.

Bob Sutor também publicou umas palavras.

A violência ficou para o sábado que antecedeu a reunião. Deivi saiu de um pub a noite para caminhar e foi atacado do nada por uns rapazes. Tomou um soco no rosto que lhe quebrou o maxilar. Fernando Gebara deu o maior apoio mas terá que ficar 6 semanas sem poder mastigar nada, nem o chocolate e queijo suiços que tanto prometeu degustar na viagem.

E agente achando que não há violência nas ruas da Europa…

Índice Linux Journal, Janeiro de 2008

  1. Receita de Linux da Novell, em milhões de dólares, no últimos 9 meses reportados: 100
  2. Aumento em porcentagem do anterior em relação ao ano fiscal passado: 243
  3. Número de metros quadrados do laboratório da aliança Microsoft-Novell: 232
  4. Receita da Red Hat, em milhões de dólares, no último trimestre reportado: 127.3
  5. Aumento em porcentagem representado pelo anterior: 28
  6. Porcentagem de computadores em escolas russas em que Linux será instalado até 2009: 100
  7. Número de computadores Linux na biblioteca pública Takoma Park, Maryland: 28
  8. Milhares de vezes que pessoas se logaram em tais computadores no último ano: 40
  9. Porcentagem de mercado de Linux em PCs conectados à Internet em janeiro de 2006: .29
  10. Porcentagem de mercado de Linux em PCs conectados à Internet em dezembro de 2006: .37
  11. Porcentagem de mercado de Linux em PCs conectados à Internet em setembro de 2007: .81
  12. Porcentagem da taxa de crescimento do mercado de Linux em PCs conectados à Internet em 2007, até agora: 219
  13. Milhões de dólares investidos em Linux e companhias Open Source por empresas de venture capital no terceiro trimestre de 2007: 77.8
  14. Milhões de dólares investidos em Linux e companhias Open Source por empresas de venture capital do primeiro ao terceiro trimestre de 2007: 226.7
  15. Milhões de dólares que a Citrix pagou pela XenSource (virtualização Open Source) em agosto de 2007: 500
  16. Milhões de dólares que o Yahoo pagou pela Zimbra (e-mail e colaboração Open Source) em setembro de 2007: 350
  17. Posição de “Faça Ubuntu laptops mais baratos que Windows laptops (em todos os países)” entre as mais populares idéias do Dell IdeaStorm: 1
  18. Posição de “Faça Linux e nenhum sistema operacional opções padrão em todos os futuros produtos” entre as mais populares idéias do Dell IdeaStorm: 2
  19. Posição de “Coloque Ubuntu na lista de sistemas operacionais quando construir um PC!” entre as mais populares idéias do Dell IdeaStorm: 3
  20. Número de resultados de uma busca por “linux” em dell.com: 648

Fontes

  • 1–5: CNET.com
  • 6: CNews Russian IT Review
  • 7, 8: Phil Shapiro in PCWorld.com
  • 9–12: NetApplications.com, via Datamation
  • 13, 14: The 451 Group, via InternetNews.com
  • 15, 16: InternetNews.com
  • 17–19: DellIdeaStorm.com em 11 de Outubro de 2007
  • 20: Dell.com em 11 de Outubro de 2007

Por Doc Searls. Original: http://www.linuxjournal.com/article/9925#mpart1

Anúncio de Abertura de Formatos e Padrões da Microsoft

Teve um remelexo hoje na indústria de TI quando a Microsoft fez seu anúncio “interoperability by design”.

Gato escaldado tem medo de água fria…

Quem se lembra da promessa de portar o Internet Explorer para Solaris? Cadê? Bem, não que agente estivesse esperando por isso, nem precisasse…

E da promessa de abrir o .NET? Falando nisso, pra que reinventar a roda com .NET quando Java já estava bombando no mercado de desenvolvimento de aplicações comerciais? Simplesmente porque — é o que a história nos mostrou — não está no DNA dessa empresa trabalhar de forma cooperativa, num esquema ganha-ganha.

Esse anúncio agente tem que contextualizar no tempo e no espaço. O tempo é 2 dias úteis antes da reunião da ISO que vai decidir o destino do OOXML como padrão. E usuários estão percebendo que seus documentos não são realmente deles e sim do dono da ferramenta que os lê e grava, o que se traduz em indignação. Então o espaço é de aperto, o aperto dos acionistas da Microsoft que pediram mais ética.

Da análise técnica do OOXML aprendi que aquilo não foi exatamente “desenhado para interoperabilidade”. As víceras tiveram que ser abertas na marra porque a vantagem do ODF era periclitante.

Em face de todos esses fatos do passado, esse anúncio, por enquanto, não passa de marketing.

Mas vamos esquecer o passado e ser otimistas. Se a Microsoft realmente estiver a fim de mudar, isso deve ser recebido de braços abertos. A Web nos ensinou que quanto mais gente colaborar melhor ela fica. Não é diferente no mundo dos padrões e tecnologias. Então Microsoft, seus clientes, programadores, concorrentes, comunidade de software livre e o mercado em geral só tem a ganhar se tanto otimismo se pagar.

Vou me manter otimista e esperar agora por ações práticas, porque o blablablá nós já ouvimos. E foi ± isso que eu disse na entrevista ao IDG.

ODF in the State of Paraná

The state of Paraná, here in Brazil, is the first to have laws that specifically promotes the use of OpenDocument Format. This is a free translation of such law:

  1. All public companies and institutions under the state of Paraná administration will adopt, preferably, open formats for creation, storage and public availability of digital documents.
  2. We understand open formats as the ones that:
    1. promote interoperability between multiple applications and platforms, internal and externally;
    2. let users chose applications free from royalties;
    3. can be freely and independently implemented by multiple computer software vendors, in multiple platforms, without any charge for the intellectual property of the technology.
  3. The companies cited in point 1 must be enabled for receiving, publishing, visualization and preservation of digital documents in open formats according to norm ISO/IEC 26300:2600 (OpenDocument format – ODF).

This law was signed by Roberto Requião, the state gorvernor, and Nizan Pereira Almeida, secretary for strategic initiatives.

Other states in Brazil, inspired by Paraná, are creating similar laws.

Folks related to the ODF initiative in Paraná

The folks in the photo, left to right, are: Henrique Menezes, government relations, IBM. Jomar Silva, ODF Alliance chapter Brazil. State congressman Edson Praczyk. Vitorio Furusho, Celepar (a state public company), BrOffice.org users group and Open Source Movement in Paraná. Reginaldo Radel, congressman Prazyk assistent.

Linux e ODF no Banco do Brasil

Logo do Banco do BrasilEssas reuniões do grupo de trabalho da ABNT servem também para encontrar velhos amigos e um deles foi o Penna do Banco do Brasil, um dos responsáveis pela adoção em massa de Linux na empresa.

Contou que 100% das agências tem seus servidores rodando Linux. 100% dos caixas de atendimento. E a grande maioria dos PCs de atendimento personalizado.

Contou que por volta de 2004 e 2005 tudo rodava sobre OS/2 e havia a necessidade iminente de sair dessa plataforma. Mas grande parte do trabalho de porte das aplicações já havia sido feito em Linux pela equipe técnica.

Migrou-se então.

Apesar de terem ainda muitos documentos legados em formatos proprietários, o uso de BrOffice.org é praticamente universal e um departamento precisa ter um motivo que justifique a compra de qualquer outra suite de escritório. Na minha opinião, BrOffice.org é gratuito e bom o suficiente a ponto de o Banco do Brasil (ou qualquer empresa) poder ser chamada de financeiramente irresponsável se não o considerar.

A partir daí, como todo funcionário tem BrOffice.org em seu PC mas nem todos tem outra suite paga, o formato de documentos que circula tem que ser algo universal. E há algo mais universal que ODF?

Certa vez o Penna me contou também que pegaram um Sharp Zaurus (PDA que roda Linux) e recompilaram as aplicações da agência para rodar nele. Sim, eles montaram uma agência de demonstração com um PDA como seu servidor, só pra mostrar a portabilidade e que é simplesmente possível.

RIO D’JANEIRO É NOSSOOOO !!!!!!!!!!1111

Quando o Brasil votou NÃO ao OOXML em agosto, anexou também sessenta e tantos comentários justificando o porquê dessa rejeição. Muitos países fizeram o mesmo, inclusive alguns que votaram SIM.

Desde novembro a ECMA tem respondido a esses comentários em forma de alterações e melhorias a especificação OOXML para remediar os problemas apontados. O Grupo de Trabalho instaurado pela ABNT que esteve analisando essas respostas terminou seu trabalho hoje e foi um sucesso. A reunião aconteceu no Rio de Janeiro.

Semana que vem acontece a reunião final da ISO em Genebra onde os países terão chance de discutir as respostas da ECMA, quais aceitaram e quais não resolveram problemas de interoperabilidade, padronização etc do OOXML. O Brasil vai levar as seguintes resoluções:

  • De fato vários problemas principalmente editoriais foram resolvidos e as modificações propostas pela ECMA foram aceitas.
  • Há ainda diversos problemas de inconsistência como multiplos formatos de datas não padronizados e que chocam entre sí.
  • Há problemas de interoperabilidade: um documento OOXML pode conter trechos binários cujo formato do conteúdo não é aberto nem está especificado. Exemplo:
    <o:ink i="AMgFHQSWC+YFASAAaAwAAAAAAMA...">
  • Há problemas de interoperabilidade com itens “deprecated”, ou seja a especificação suporta sub-formatos proprietários antigos junto com novos para coisas do tipo representação de funções matemáticas, desenhos vetoriais etc. Neste ponto, a posição do Brasil é de que só deve entrar na especificação ítens “deprecated” que não se pode converter automaticamente, por exemplo, de .DOC para .DOCX.
  • Outros aspectos relacionados a falta de documentação na especificação.

A somatória desses ítens por enquanto mantém o voto do Brasil: NÃO ao OOXML.

Além disso, o grupo varreu e classificou também diversos comentários de outros países — e suas respectivas respostas da ECMA — para que a delegação brasileira possa argumentar quando esses pontos forem discutidos na reunião da ISO.

O trabalho do grupo foi excelente, de alto nível, pragmático e saudável. E por isso eu gostaria de agradecer e rasgar a seda:

Fernando Gebara da Microsoft que coordenou as reuniões, fez o “trabalho sujo” de documentação, agendar calls, administrar portais, wikis etc, manteve a neutralidade técnica que sem ela todo o trabalho teria empacado na guerra ideológica. Jomar Silva da ODF Alliance, o Homembit, que foi o catalisador e hub de toda a comunidade livre nessa empreitada, além de mergulhar de cabeça na missão técnica. Deivi Kuhn do SERPRO que se envolveu em cada detalhe e mereceu ser o chefe da delegação a Genebra. Marisa Rublescki do SERPRO também superenvolvida, responsável e dona de um olhar clínico para debulhar especificações gigantescas. Murilo Barreto do Banco do Brasil, pela dedicação e magia negra contra sua agenda apertada. Daniel Assad e Leandro Jekimim, da facção da UNESP a favor do OOXML, por trazerem argumentos técnicos para a discussão. Cezar Taurion da IBM, articulador, blogueiro, evangelista e fonte de inspiração para todos. E tantos outros que trabalharam na linha de frente ou retaguarda para esse trabalho sair, um muito obrigado.

Como essa reunião era do comitê que trata de padrões de documentos, foi feita também uma deliberação para acelerar a aprovação do ODF como o padrão brasileiro de documentos. E, na verdade por causa disso, RIO D’JANEIRO É NOSSOOOO !!!!!!!!!!1111

PS: O Jomar publicou mais alguns detalhes, alguns bem irônicos. Confira.

Ted Tso Quer Brasileiros Trabalhando no LSB

Ted TsoAcabei de tomar um café com o Theodore Tso (blog), um dos jedi master hackers do universo Linux e Open Source de todos os tempos.

Acontece que ele trabalha na IBM a alguns anos e atualmente está num assignment temporário na Linux Foundation (a mesma casa do Linus Torvalds) focado em melhorar o framework LSB, que padroniza as distribuições Linux do ponto de vista das aplicações.

Ele está no Brasil por alguns dias entrevistando talentos, especialmente estudantes, para trabalharem com ele nessa empreitada. Um trabalho que deve ser prá lá de divertido também pela quantidade de interações com celebridades da comunidade Linux.

Boa sorte aos que conseguirem sua vaga na Linux Foundation !

Web 2.0 Party

Web 2.0 is about people. Its a global party where human beings exchange knowledge, experiences, information and even emotions.

Yesterday I saw the Xanadu movie again with ELO’s All Over the World, a good-vibe song from the 80’s that still has very current lyrics that explain what people are doing in our 2008’s Web 2.0.

Check out the movie excerpt with the song and the lyrics.

Everybody all around the world
Gotta tell you what I just heard
There’s gonna be a party all over the world

I got a message on the radio
But where it came from I don’t really know
And I heard these voices calling all over the world

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

Everybody walkin’ down the street
Everybody movin’ to the beat
They’re gonna get hot down in the U.S.A.
(New York, Detroit, L.A.)

We’re gonna take a trip across the sea
Everybody come along with me
We’re gonna hit the night down in gay Pareee

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

London, Hamburg, Paris, Rome, Rio, Hong Kong, Tokyo
L.A., New York, Amsterdam, Monte Carlo, Shard End and

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

Everybody all around the world
Gotta tell you what I just heard
Everybody walkin’ down the street
I know a place where we all can meet
Everybody gonna have a good time
Everybody will shine till the daylight

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

All over the world
Everybody got the word
All over the world
Everybody got the word
All over the world
Everybody got the word

Ditados Populares Atualizados

Recebi isso por e-mail e achei bem oportuno, e um barato.

  1. A pressa é inimiga da conexão
  2. Amigos, amigos, senhas à parte.
  3. Antes só do que em chats aborrecidos
  4. Arquivo dado não se olha o formato
  5. Diga-me qual a sala de chat que você freqüenta e te direi quem és!
  6. Para todo bom provedor uma senha basta.
  7. Não adianta chorar sobre o arquivo deletado.
  8. Em briga de namorados virtuais, não se mete o mouse!
  9. Em casa de programador, o espeto é de par trançado
  10. Em terra off-line, quem tem 486 é rei!
  11. Hacker que ladra, não morde!
  12. Mais vale um arquivo no HD do que dois baixando…
  13. Mouse sujo se limpa em casa!
  14. Melhor prevenir que formatar.
  15. O barato sai caro e lento…
  1. Programa velho é que faz site bom…
  2. Quando a esmola é demais, o santo desconfia que veio algum vírus anexado!
  3. Quando um não quer dois não teclam!
  4. Quem ama um 486, Pentium 4 lhe parece!
  5. Quem clica seus males multiplica!
  6. Quem com vírus infecta, com vírus será infectado!
  7. Quem envia o que quer, recebe o que não quer!
  8. Quem não tem banda larga, caça com modem!
  9. Quem nunca errou, que aperte a primeira tecla!
  10. Quem semeia e-mails, colhe SPAM!
  11. Quem tem dedo vai a Roma.com !
  12. Um é pouco, dois é bom, três é chat!
  13. Vão-se os arquivos e ficam os back-ups!
  14. Vírus no winchester dos outros é refresh!

OOXML Tem Nome Inapropriado

Vejam esta conversa com uma agente de marketing e comunicações, por mensagem instantânea:

  • Ela: Recebemos a ligação de um jornalista da ###### dizendo que a IBM apoia o padrão XML porque os programaa IBM Lotus Quikr , IBM Websphere Portal , IBM DB2 9 XML suportam XML… vc sabe dizer se é verdade ? E se sim, porque fazemos isso ?
  • Eu: XML é um padrão universal de todos… com certeza apoiamos! Mas acho que ele quis dizer “Office OpenXML” da MS.
  • Ela: isso… quer dizer que estes produtos suportam XML não OPEN XML da MS ? é isso ? entendi certo ?
  • Eu: sim… todo mundo suporta XML… mas “Office Open XML” só a MS suporta
  • Ela: ah….
  • Eu: se “XML” fosse um “meio de transporte genérico”, então “Office OpenXML” seria um “Gol GL 1.6”.
  • Ela: ahah… essa foi boa

Ou seja, tem muita gente trocando as bolas entre XML e OpenXML, especialmente gente que tem acesso a mídia.

Índice Linux Journal, Dezembro de 2007

  1. Porcentagem mínima do tráfego da Internet identificado como ponto-a-ponto (peer-to-peer): 50
  2. Porcentagem máxima do tráfego da Internet identificado como ponto-a-ponto (peer-to-peer): 90
  3. Porcentagem mínima do tráfego ponto-a-ponto que usa BitTorrent: 50
  4. Porcentagem máxima do tráfego ponto-a-ponto que usa BitTorrent: 75
  5. Porcentagem de americanos entrevistados que acreditam que a constituição estabelece uma nação cristã: 55
  6. Número de vezes a palavra “Christian” (Cristão) aparece na constituição: 0
  7. Número de vezes a palavra “God” (Deus) aparece na constituição: 0
  8. Número de vezes a palavra “liberty” (liberdade) aparece na constituição: 3
  9. Número de vezes a palavra “freedom” (liberdade) aparece na constituição: 1
  10. Milhões de récordes de estudantes belgas gerenciados por uma suite de gerência de processo de negócio (business proccess management suite, BPMS): 1
  11. Milhares de escolas envolvidas no BPMS belga: 3
  12. Milhares de clientes da Intalio, o criador open-source do BPMS belga: 10
  13. Preço da ação da SCO em centavos no dia em que fez o pedido de falência: 37
  14. Milhões de dólares que a Rackspace vai investir no novo sede em San Antoni: 100
  15. Milhares de novos empregados que a Rackspace pretende contratar em sua nova sede: 4
  16. Milhares de hostnames servidos pelos datacenters da Rackspace: 920
  17. Número de anos que a Rackspace está no radar da Netcraft com seus web servers Linux: 11
  18. Porcentagem de mainframes IBM System z que se calcula rodarem cargas de Linux: 25
  19. Porcentagem de disconto no preço do System z especializado para rodar Linux: 90
  20. Número de servidores que a IBM está consolidando em 30 mainframes System z rodando Linux no projeto Big Gree: 3900

Fontes

  • 1, 2: Ipoque.com, sourced by ArsTechnica.com
  • 3, 4: Ellacoya Networks, sourced by ArsTechnica.com
  • 5: First Amendment Center
  • 6–9: USConstitution.net
  • 10–12: Intalio, Inc.
  • 13: TheStreet.com
  • 14–17: Netcraft.com
  • 18, 19: searchenterpriselinux.com
  • 20: IBM

Por Doc Searls. Original: http://www.linuxjournal.com/article/9890#mpart1

Índice Linux Journal, Novembro de 2007

  1. Velocidade média medida em MBps de uma conexão de banda larga com velocidade de download de “até 8Mbps”: 2.7
  2. Menor velocidade medida em MBps de uma conexão de banda larga com velocidade de download de “até 8Mbps”: 90
  3. Quantos, entre 5 consumidores, recebem a velocidade de banda larga contratada: 1
  4. Porcentagem de consumidores pesquisados que se sentiram desorientados pelas propagandas dos provedores: 30
  5. Bilhões de usuários de Internet em 2006: 1.1
  6. Usuários de Internet adicionais esperados até 2010, em milhões: 500
  7. Milhões de streams de vídeo servidos por dia pelo YouTube: 100
  8. Número de câmeras de segurança em Londres: 200
  9. Trilhões de bits enviados pelas câmeras de segurança de Londres aos seus data centers: 64
  10. Terabytes acumulados por dia pela Chevron: 2
  11. Número total de exabytes em dados em 2006: 161
  12. Múltiplo em milhões do total de dados de 2006 para toda a informação em todos os livros jamais escritos: 3
  13. Porcentagem do universo digital que vai ser criado por individuais em 2010: 70
  14. Porcentagem do universo digital corrente que está sujeita a regras de compliance e padrões: 20
  15. Porcentagem do universo digital corrente que está potencialmente sujeita a aplicações de segurança: 30
  16. Exabytes de “conteúdo criado pelo usuário” projetado para 2010: 692
  17. Total de exabytes de dados projetados para 2010: 988
  18. Porcentagem do universo digital de 2010 no qual organizações serão responsáveis por segurança, privacidade, confiabilidade e compliance: 85
  19. Capacidade em exabytes de mídia pronta para armazenar dados novos e replicados no universo digital de 2010: 601
  20. Ano em que a quantidade de informação criada vai ultrapassar a capacidade de storage disponível pela primeia vez: 2007

Fontes

  • 1, 2: which.co.uk, sourced by David Meyer for ZDNet UK
  • 3, 4: moneysupermarket.com, sourced by David Meyer for ZDNet UK
  • 5–20: “Expanding the Digital Universe”, by John F. Gantz, et al., a March 2007 IDC whitepaper

Por Doc Searls. Original: http://www.linuxjournal.com/article/9871#mpart1

Índice Linux Journal, Outubro de 2007

  1. Quantos dólares a mais um Dell Inspiron 1420, baseado em Linux, custa comparado ao mesmo rodando Vista, antes do erro ter sido corrigido: 225
  2. Quantos dólares a menos um Dell Inspiron 1420, baseado em Linux, custa comparado ao mesmo rodando Vista, depois do erro ter sido corrigido: 50
  3. Preço base corrigido de um notebook Dell 1420 Inspiron rodando Ubuntu: 774
  4. Número de opções de cores para o 1420: 8
  5. Porcentagem de computadores revitalizados pelo Alameda County Recycling Center (ACCRC) que rodam Linux: 100
  6. Preço cobrado pelo ACCRC para receber qualquer computador: 0
  7. Preço cobrado pelo ACCRC para receber “qualquer coise que você possa conectar na tomada” que não seja grandes dispositivos não-computacionais e monitores e TVs: 0
  8. Preço em centavos cobrado por libra por receber monitores e TVs: 50
  9. Milhares de sistemas rodando Linux com suporte dados pelo ACCRC por ano: 1
  10. Milhares de novos sites rodando Apache encontrados pelo Netcraft em sua pesquisa de julho de 2007: 556
  11. Milhares de novos sites do Google encontrados pelo Netcraft em sua pesquisa de julho de 2007: 592
  12. Milhões de novos sites Microsoft encontrados pelo Netcraft em sua pesquisa de julho de 2007: 2.4
  13. Porcentagem do Apache de todos os sites ativos pesquisados pelo Netcraft: 49.98
  14. Porcentagem de Microsoft de todos os sites ativos pesquisados pelo Netcraft: 35.48
  15. Porcentagem do Google de todos os sites ativos pesquisados pelo Netcraft: 4.35
  16. Porcentagem do Google de todos os sites ativos pesquisados pelo Netcraft em julho de 2006: 0
  17. Vantagem na porcentagem do Apache comparado a Microsoft em julho de 2006: 33.4
  18. Vantagem na porcentagem do Apache comparado a Microsoft em julho de 2007: 14.5
  19. Porcentagem de desenvolvedores norte-americanos de olho em Linux em 2007: 11.8
  20. Crescimento percentual do anterior comparado a 2006: 34

Fontes

  • 1–3; 18–20: DesktopLinux.com
  • 4–7: APPC (www.accrc.org)
  • 8: ZaReason, Inc.
  • 9–17: Netcraft.com

Por Doc Searls. Original: http://www.linuxjournal.com/article/9768#mpart1

Índice Linux Journal, Setembro de 2007

  1. Dólares gastos pela nike em seu logotipo swoosh: 35
  2. Bilhões de dólares gastos em marketing no ano passado pela Nike: 1.7
  3. Porcentagem de web sites que são pornográficos: 12
  4. Porcentagem de requisições por pornografia em mecanismos de busca: 25
  5. Porcentagem de pornografia em todos os downloads: 35
  6. Número de usuários vendo pornografia por segundo: 28358
  7. Dólares americanos gastos em pornografia a cada segundo: 89
  8. Número de novos sites de pornografia surgindo todos os dias: 266
  9. Bilhões de páginas web estimadas: .372
  10. Posição de “sex” entre as palavras mais procuradas: 1
  11. Renda em 2006 proveniente de pornografia na Internet, nos EUA, em bilhões de dólares: 2.84
  12. Porcentagem masculina dos usuários de pornografia na Internet: 72
  13. Porcentagem de tráfego de pornografia durante as 8 horas úteis do dia: 70
  14. Porcentagem de sites de pornografia produzidos pelos EUA: 89
  15. Posição do AdultFriendFinder entre os sites de pornografia mais populares: 1
  16. Número de sites AdultFriendFinder acompanhados pelo Netcraft: 75
  17. Número de sites AdultFriendFinder que sabe-se serem servidos por Desconhecido: 46
  18. Número de sites AdultFriendFinder que sabe-se serem servidos por Windows: 1
  19. Número de sites AdultFriendFinder que sabe-se serem servidos por BSD: 2
  20. Número de sites AdultFriendFinder que sabe-se serem servidos por Linux: 28

Fontes

  • 1–15: Good Magazine
  • 16–20: Netcraft.com

Por Doc Searls. Original: http://www.linuxjournal.com/article/9786#mpart1

Tecnologia Orgânica

Numa cobertura do evento CES no caderno Link do Estadão, entre um monte de matérias sobre as novas tralhas tecnológicas apresentadas lá, há uma nota tímida sobre as bizarricies do evento.

Uma delas é uma bateria ou pilha que é recarregada com líqüidos tipo saliva ou urina.

Uma ótima invenção, de um gênero que deveria ser cada vez mais incentivado !

Porque afinal, toda essa mobilidade eletrônica e digital que a gente gosta cobra seu preço ao meio ambiente.

Diga-se de passagem, isso me lembrou as stillsuites do fictício universo de Duna (livro e filme): roupas especiais que capturam e reciclam a umidade do corpo de quem a veste, para serem usadas em ambientes inóspitos como o planeta-deserto Duna.