Upgrade to WordPress 2.5

This is my first post in the new WordPress 2.5.

Upgrade was as easy as:

$ cd avi.alkalay.net
$ svn sw http://svn.automattic.com/wordpress/tags/2.5/

Everything worked without any changes, including my experimental content-optimized Plasma theme.

The new WordPress has lots of improvements, specially in the administration part and I recommend it.

OOXML: Open Letter to YES-voting and ABSTAIN-voting Countries

I am learning a lot from all this standardization process.

I was a member of the brazilian committee and I also analyzed the specification. My country disapproved OOXML and I think this was a decision based on logic lead by the process.

The JTC1 rules page 49 item 9.8 says:

NBs may reply in one of the following ways:

  • Approval of the technical content of the DIS as presented (editorial or other comments may be appended);
  • Disapproval of the DIS (or DAM) for technical reasons to be stated, with proposals for changes that would make the document acceptable (acceptance of these proposals shall be referred to the NB concerned for confirmation that the vote can be changed to approval);
  • Abstention (see 9.1.2).

[Note: Conditional approval should be submitted as a disapproval vote.]

In other words, from my understanding, if there is one or more technical problems, the NB must disapprove the DIS. Many countries found many technical problems in OOXML that are still unresolved even after the BRM.

I also understand that such an important matter as an International Standard for Office Documents can’t be defined by 10 or 30 opinions collected as votes in a committee. Thats why the JTC1 process above talks about technical content, not opinion or vote. What I learned from studying the OOXML specification is that it is not ready for acceptance since many countries have found and reached consensus that the spec has problems, even after the BRM. If the NB-leveraged technical team — formed by people that would vote YES and NO — has produced a list of submitted problems in the spec, this list is by itself the consensus that the spec is still problematic.

I would like to understand why an NB that has produced technical comments voted YES or ABSTAINED. I thought abstention is a position for countries that were not able to create a committee to technically discuss the specification for reasons such as logistics or lack of quorum.

I am learning about all this and I’d like to have more solid arguments to build an opinion about these NB’s maturity to run a well documented process.

OOXML: Venezuela changed vote from YES to NO

Check it out:

From: “***FONDONORMA***” <in*&%@fondonorma.org.ve>
To: <ki*%$#@itscj.ipsj.or.jp>, <br*%$#%@iso.org>, <tak*%$#%@iso.org>, <ga*%$#%@iso.org>, “Maria Teresa Saccucci” <mar*%$#%@fondonorma.org.ve>, “Norma Arias” <norm*%$#%@fondonorma.org.ve>, “***FONDONORMA***” <in*%$#%@fondonorma.org.ve>
Date: Fri, 28 Mar 2008 14:04:26 -0430
Subject: Modification to the vote on DIS 29500 – Venezuela (FONDONORMA)
Toshiko Kimura
Secretary ISO/IEC JTC 1/SC 34

Att.: Mr. Keith Brannon, Mr. Maho Takahashi, Ms. Martine Gaillen

Dear Mr. Kimura,

Attached please find a letter from Mrs. María Teresa Saccucci, Standardization Manager of FONDONORMA (Venezuela) through which Venezuela wishes to modify its position on DIS 29500, Information technology – Office Open XML file formats from “Approval with comments” to “Disapproval with comments”.

Best regards,

Leonardo Di Bartolo
Coordinator of International Relations
FONDONORMA
Venezuela

This NO was a result of a very difficult meeting. Consensus was not reached and a lot of confusion happened. Exactly as in the first brazilian NO.

The NB had to decide the final vote based on technical issues still open in OOXML. The problem was the method of deciding and those technical points were not presented. So people only had in their head the Microsoft arguments that I already knew were part half trues and part complete lies.

I participated in the OOXML process in 3 countries and I was able to build an opinion on how normalization happens today in the world, and I’ll show some ideas in a future post.

By the way, this is how Caracas looks like, a city surrounded by huge green mountains that have behind them the Caribbean Sea.

Caracas from the EuroBuilding hotel

Caracas and the Caribbean Ocean in the map
Caracas from the EuroBuilding hotel

OOXML’s BRM: A flow of dirt

Finally Jomar, one of the brazilian delegate that went to OOXML’s BRM in Geneva has started to tell all the dirty little details of what really happened in that meeting and the surreal modus operandi of how 120 people can discuss 1027 issues in 5 days. Have fun in english and portuguese.

Oh, and talking about dirty playing, check the domain www.DocumentFreedomDay.com but remember that the original one is www.DocumentFreedom.org. The first one really deserves a DDoS attack.

OOXML: Brazil Says NO. Again.

It is now official. Brazilian vote was decided by consensus of the entire technical team, including Microsoft crew’s: OOXML does not deserve to be an international ISO standard.

Our first vote, in august, was also NO, due to the same reasons: OOXML is an awful specification.

That outcome was expected because we simply followed the process: technically analyze the OOXML specification, make comments, wait for responses, analyze them and see if all problems were fixed. Is there any single remaining unresolved problem? Vote NO. And in fact there were many many unresolved problems.

If every country followed this simple process, OOXML would receive a NO from 100% of them.

But in some countries, how is the process? Invite a few companies and simply count their votes. The problem here: 10, 20 or 80 votes can never represent what is the best for that country. Only, maybe, if you collect one vote for each citizen.

What I am trying to say is that in this case a decision must be reached by technical consensus, not vote. It is not a matter of will, but a technical issue that can only be reached by rational analysis and deliberation.

In Chile for example, 21 voting companies will define a 15 million people country vote in ISO. How easy is to lobby these 21 companies with Power Point presentations telling complete plain lies ?

Technically speaking, if your country’s vote was YES or ABSTENTION, one of these possibilities happened:

  1. Nobody had time to analyze the OOXML specification and the ABSTENTION was the right choice.
  2. Nobody had time to analyze the OOXML specification and a few people decided for you to vote YES, based on ideology or a result of lobby, not technology benefits.
  3. Even having time to analyze the OOXML specification, a few people decided for you to vote YES, based on ideology or result of lobby, not technology benefits.

Seems stupid, but these are exactly the 2 possibilities of OOXML getting YES votes in ISO. It is still an awful specification.

By the way, Brazil would vote NO again and again and again even if all OOXML’s technical issues could be resolved. OOXML would still have legal issues and also serious overlap problems with the OpenDocument Format ISO standard.

I was not present in today’s meeting in ABNT because I already knew what would be the result, since the process of analysis and deliberation in Brazil was very strictly followed. Hopefully Jomar will write about it and you can check more details.

Open Source Software inside the iPhone

Can Open Source Software be more ubiquitous than this ?

A few days ago I was playing extensively with Apple’s iPhone, investigating each sub-menu and little details. There is a section listing legal stuff and software being used with each license. GPL, LGPL, BSD and other Open Source licensed software rule the iPhone.

Some I have noted:

Microsoft sells Intra-operability as Interoperability

Interoperability

This is real Interoperability

  • Technical specifications for global interoperability and freedom
  • Interoperate through standards
  • Software product is less important
  • Switch products and keep access

Microsoft started their so called “interoperability” initiative. With a deeper look we find that the main objective of the released specifications is to let developers interact with their products only, something I like to call Intra-operability.

Intraoperability

This is Intraoperability

  • Technical specifications for interaction with and favor the product
  • Interoperate through the product
  • Software product is the main player
  • Switch product and loose access

See the difference?

Microsoft technical specifications have serious technical and legal issues, and are being released not to increase interoperability across people, organizations and applications, but to leverage the use of their products. For the standard document format scenario: OOXML is about allowing other people to interact with files that are primarily generated and manipulated with Microsoft Office. It is not about full interoperability, which would enable competition with Microsoft Office, for obvious reason.

For each purpose or scope, better open standards exist and should be adopted and used instead: Java versus .NET, XHTML versus IE-campatible-only DHTML, ODF versus OOXML, etc

My friend Cezar Taurion has also written some words about Intra-operability (in portuguese). Bob Sutor also put together some words about it.

These graphics are available in a friendly Creative Commons license, in this animated ODF file, in case you want to integrate them in your presentations. PDF export also available.

How Microsoft raped ISO

One of the most critical and discussed points of the whole OOXML subject is how the specification lets you include binary proprietary information.

Let me show you how it happens with a piece of an OOXML document, the red-marked text is the problematic part (see for yourself, §6.2.2.14, paper page 4,813, lines 7–13):

<v:shape>
<o:ink i="AMgFHQSWC+YFASAAaAwAAAAAAMA..." annotation="t" contentType="application/x-ms-ink"/>
</v:shape>

So you, as a programmer, please tell me what to do if you are developing an application that must read and generate this kind of document. How can I find documentation about this encoded binary stream? Is this a good practice in XML? Anyway, this kind of (bad) design appears in many parts of the OOXML spec. Want more examples of bad design? Have fun.

Suppose I really want to develop this kind of support in my application, I am a master programmer and reverse-engineered a few examples generated with a copy of MS Office 2007 that I had to buy. Or maybe I just found the specification of this proprietary application/x-ms-ink type and go to develop a library to handle it.

Inevitably, my library will reimplement aspects of some Microsoft library with same functionality, and according to a Software Freedom Law Center report, the Microsoft Open Specification Promise (OSP, basically the not-open-enough license Microsoft lawyers wrote for the usage and implementation of OOXML) cover’s the specification only, not code.

I will be sued for patent infringement. On software rewrite, not on specification usage.

Then the rape begins. Microsoft is claiming that this was solved in the ISO’s BRM meeting. This is the solution, from the ridiculous 12 pages resolutions, page 7:

Resolution 25: The BRM decides to accept the editing instructions contained in http://www.itscj.ipsj.or.jp/sc34/def/BRM/Response_0135_bitfields.doc in place of R 135, replacing “deprecated” by “transitional”, and with the following addition: The Editor shall ensure that all existing attributes defining the bitfields described above shall be “transitional”—so resolved.

Who reads this resolution with high level eyes may think that all binary fields will be removed from the specification. But please, you, as a programmer, tell me how the so called Editor will find all and every single part of a 6000+ pages specification containing bitfields? How he’ll expand all those bitfields in an XML subspecification? Will he invent some? Is he the right person (or team) to do that?

When done and if done, the specification will be something completely new, full of new parts. Will jump from 6063 pages to maybe 7500. Oh, and did I mention it will be something that even MS Office 2007 or 2008 don’t support today? Supporting or not, implemented or not, this new unexistent specification is the “thing” that countries’ National Bodies are voting right now, without even seeing it, without checking if it was corrected, without having time for this because they didn’t receive it for revision.

They won’t have time to review 6000+ pages because the deadlines defined by the ISO’s Fast Track process are over.

So the question is how ISO/IEC and JTC1 let such a big and problematic specification enter the light Fast Track process? My answare: ISO was raped.

I’ve been talking to several people that will define their country’s vote and their mindset is “are you really putting ISO in such a bad position?” Well, yes. You know, in the end ISO is not god. They are a bunch of people that, like you and me, have religions, aspirations, problems, family, go to the bathroom etc. Like you and me, they may be also naive in regard to some subjects, particularly document formats. Then comes Microsoft excellent speakers showing PowerPoint charts that are plain lies (e.g. “OpenOffice.org supports OOXML”) and people believes them.

People have two choices: to question ISO’s reputation in the OOXML case, or question IBM, Sun, Oracle, Red Hat, Free Software Law Center, ODF Alliance and many other institutions’ reputation when they massively scream in chorus that OOXML has serious technical, legal and standardization process issues.

This is a world where organizations like ECMA has completely lost the respect of the technical community. But this is not a big problem, because we have other similar, still reliable bodies as OASIS, W3C, OSF, etc.

This is a world where we will have to work hard to make ISO regain its (currently damaged) reliable status. This is a big problem, because we only have one (and only need one) International Standards Organization.

This is your responsibility. To start this work get involved with your country’s National Body for standardization and promote the creation of a formal letter to ISO about the OOXML process, its problems and how ISO let that happen. INCITS in USA, ABNT in Brazil, INN in Chile etc.

OOXML in Numbers

This is a numerical photography of what is the Microsoft Office Open XML wannabe specification:

  • 6063 pages written in 12 months
  • Only 6 months of analysis pointed 3500 issues that span from intellectual property, to standard date & time representation, to malformed XML definitions, to binary proprietary bits
  • 3500 issues where summarized in “only” 1027
  • ECMA proposed 2293 pages of mutually conflicting changes to make happy those 3500 comments
  • Only 30 days to analyze those 6063+2293 pages against those 3500 comments
  • Only 5 days of BRM to discuss 6063+2293 pages
  • Only 18% of these 1027 problems where discussed in BRM
  • 82% of problems were not even discussed
  • BRM produced a short 12 pages document containing alterations to those 6063 pages long spec based on 2293+thousands of pages of comments from all countries+19 months of technical writing and global analysis work. By the way, those short 12 pages propose such nebulous alterations — as Resolution 25 on page 7 — that it is difficult to foretell how they will technically fit in the new specification. If applied, those alterations could turn the original spec upside down, so deeply that it could become a completely new specification, maybe even worse than the first one.
  • Now countries must vote if they approve or not this still unfinished new OOXML that will be divided in 4 independent parts for strict conformance class+4 parts for transitional (deprecated) conformance class. These final multipart wannabe standards don’t exist yet and will be released about the same day countries will have to vote for it.

Or graphically:

History and confusion of OOXML

And you still think OOXML is ready to become an International Standard Format for storing YOUR documents ?

Come on, give me a break !

OOXML na ISO e os números que na verdade não existem

Li algumas coisas na Internet sobre o resultado final do BRM. Em alguns lugares encontrei números e interpretações das mais diversas sobre estes resultados. Como faço parte do comitê da ABNT que analisou o OOXML, resolvi conversar com o Jomar, que foi um dos delegados brasileiros em Genebra.

Ele me disse que não pode comentar nada sobre estes números e sobre o resultado, pois no último dia do BRM, a autoridade da ISO lá presente alertou a todos que nenhum número deveria deixar a sala de reuniões, pois sem conhecer os processos de decisão lá adotados, nenhum número ou estatística faz sentido.

Avisou ainda que qualquer divulgação ou utilização marketeira destes números é no mínimo irresponsável e segundo o entendimento dele uma
clara violação das regras estabelecidas (mas aliás… alguma regra foi seguinda neste processo todo ?).

Eu tentei insistir com o assunto (e olha que o cara é meu amigo), mas ele se recusou a me dar mais informações. Me pediu apenas para entrar em contato com quem divulgou as informações e pedir a ele os devidos esclarecimentos (incluíndo os critérios e regras de votação).

Como eu sou insistente mesmo, acabei arrancando pelo menos uma explicação metafórica dele:

“Se eu te disser que 85% da população mundial sobreviveu à II Guerra Mundial, você consegue concluir que esta guerra não foi tão ruim assim? Se não consegue é porquê conhece os detalhes do processo. Se consegue… vai ler os livros de história e estudar o processo e aproveite pois este episódio não teve uma “Lei do Silêncio” que obrigou todos os envolvidos a se calar. O BRM não vai ter “livro de história” para explicar a estatística.”.

Números são apenas números e marketing será sempre marketing (e o Jomar não abre a boca mesmo… que chato).

OOXML: Está rolando um barraco na ISO

Veja como as coisas são…

Segundo o post do Jomar que esteve no BRM da ISO, um cidadão chegou nele num intervalo e sutilmente pediu para que não levantasse uma questão importante no processo do OOXML da Microsoft virar ou não um padrão ISO: a inexistência do mapeamento entre o formato legado (ex: .doc) e o formato novo (ex: .docx).

Sem esse mapeamento, o propósito primordial da existência do OOXML como padrão ISO deixa de existir.

Só pra lembrar qual é o propósito do OOXML, extraido (em livre tradução) de sua especificação:

O objetivo deste padrão [OOXML] é […] representar fielmente o corpo de documentos existentes […]

Os tais “documentos existentes” são no caso todos os documentos em formato binário legado do MS Office (.doc, ,ppt, .xls), algo fora do escopo do OOXML.

Se esse mapeamento não fizer parte da especificação OOXML, seu objetivo primordial é inválido. A especificação é inválida. E a delegação brasileira queria levantar essa bola: cadê o mapeamento ?

Mas o barraco aqui é outro. Um cidadão pedir pra ele não levantar essa bola é uma coisa. Sei lá, tal cidadão deve ter razões políticas ou financeiras para querer ver uma especificação com sérios problemas conceituais [OOXML] virar um padrão internacional.

O que me escapa o entendimento é por que a ISO não deixou o Brasil apresentar esse questionamento ?

Só sei que a blogosfera vai desabar sobre esse assunto nos próximos dias e vou acompanhar de perto os blogs do Rob Weir, Bob Sutor, Andy Updegrove, Groklaw e a quantidade de reações que o post traduzido do Jomar recebe. Muitos desses blogs já estão descendo a lenha.

How to Make High Quality DVD Rips

Some friends asked so the following is how I encode (rip) DVDs.

Choosing the file format: .AVI, .OGG, .MP4 or .MKV ?

The ripped video file format is a decision you must make. Currently my format of choice is .MKV or Matroska. I’ll explain why.

It is quite silly to say that an .MP4 movie has better quality than a .AVI or vice-verse (or any other combination of comparisons). OGG, MP4 (MPEG-4 Part 14), MKV (Matroska), AVI, WMV (or ASF) are just containers, envelopes. Video quality depends on what goes inside it.

“Multimedia” has this name because you have multiple types of media: video in multiple angles, multiple audio options including different languages and channels (stereo, 5.1, 6 channels etc), subtitles in several languages, chapter information, menu etc. Think about a DVD. So this is a graphical view of how things are organized inside a 900MB movie file in a modern format as MKV or MP4:

Header with tags, track names, chapters info, seek positions Main Video track (MPEG-4 AVC/H.264) Attachments as JPG images, documents, scripts or text files
Video segment showing another angle (MPEG-4 ASP/Xvid/DivX)
Audio track: English Dolby Surround 5.1 (AC3)
Audio track: Director’s comments stereo (MP3)
Audio track: Portuguese Dolby Surround 5.1 (DTS)
Subtitle track: Portuguese (Unicode text)
Subtitle track: Chinese (Unicode text)
Subtitle track: English (VobSub)
byte 100K byte 100M byte 200M byte 310M byte 420M byte 530M byte 650M byte 780M byte 895M byte 900M

A digital multimedia file format must be capable to contain all this different medias and multiplex them in parallel so you won’t have the video in the first 500MB of the file and the audio on the following 500MB (this can’t work for streaming). And this is exactly what modern file formats as MP4 and MKV do: they carry all your movie-related data together.

This is a comparison of all these file formats based on my personal experience with them (a more formal comparison can be found in Wikipedia):

.MKV .MP4 .AVI
Industry support Almost none Good and increasing, specially on Apple platforms, the mobile scene and Nero Digital ecosystem Treated as legacy popular format
Usage on the web Very popular on HD or high quality DVD rips Very popular on HD or high quality DVD rips, supported by Flash Player, YouTube, Google Video Popular amongst low-quality DVD rips
Support for advanced video formats and multiple video angles Yes. MPEG-4 ASP (DivX, Xvid), MPEG-4 AVC (a.k.a. H.264) etc Yes. Only MPEG-4 systems and a few others Problematic and No
Support for multiple audio tracks (channels, formats, languages and “director’s comments”) Yes Yes. Formats are only MP3, AAC and a few others not very popular Yes
Support for tags (artist, title, composer, etc as MP3’s ID3) Yes Can be supported by MP4 extensibility but this is not very well standardized across authoring tools (iTunes, GPAC etc) and players (Amarok, Media Player Classic, iPod, Windows Media Player etc) No
Support for attachments with mime-types (used to attach movie posters images or other files) Yes No
Support for chapter marks Yes No
Support for multiple language embedded soft-subtitles Yes. VobSub (as extracted from DVDs), plain timed UTF-8 text (SRT, SUB) etc No
Support for naming tracks with human names as “Director’s comments” or “Portuguese subtitles” etc Yes Yes No
Support for carrying menus information (as in DVDs) and interaction Yes through an XML idiom, but unsupported by most players Yes through SVG, but unsupported by most players No
The container overhead in bytes in the final file Very small Very small Very big
Supported by free and Open Source multiplatform authoring tools Perfect on Linux, Unix, Windows and Mac Yes (see GPAC), with some intellectual property issues. Tools need to mature. Yes
Ready for popular web streaming as in Flash player No Yes. The popular Flash Player that is installed on everybody’s browser supports playing MP4 files as long as they contain H.264 video and AAC audio tracks. I recommend the LongTail FLV/MP4 Player since it also plays subtitles embedded in MP4 files. No

Personally I believe MP4 is the multimedia file format for the future because since it is getting popular, all these non–standardized features will get stabilized. MP4 is an ISO standard and the increasing industry support can be felt on iPods and portable devices, and most notable on home DVD players capable of playing the 700MB MP4 video file burned in a CD.

By the way, remember this:

  • MP4 is not an evolution of MP3. AAC (MPEG-4 Part 3) is.
  • MP5 and MP6 (used to classify portable media players) are things that simply doesn’t exist in the multimedia scene.
  • .M4A, .M4V, .MOV and .3GP files can safely be renamed to .MP4. They just use to be different extensions to help user’s eyes easily identify whats inside.

Meanwhile, MKV wins everything but on the Industry Support category. But this doesn’t really matter, and I’ll explain why. Since MKV is just a container, the large video, audio etc streams can be extracted and repackaged into MP4 and vice-versa in seconds. No transcoding (decoding followed by a lossy encoding into another format) is needed.

So today I store my videos in the most feature rich and well supported by players format: MKV.

OGG or OGM (the container file format) is practically dead in my opinion. They were created as part of the Xiph initiative for a complete open source patent-free multimedia framework, but seems nobody uses it anymore for video. From the same family, Vorbis (the audio codec compared to MP3, a.k.a. .OGG) is very good but also very not popular. Theora (the video codec) is frequently comparable to old MPEG-1 in terms of quality and compression ratio so currently, if you want quality and are not concerned about patents, MPEG-4 AVC is the best choice. FLAC, Xiph’s lossless audio codec, is the winner of the family: very popular, massively used, and recommended.

Encoding the DVD

I use HandBrake, the most practical Open Source (and overall) movie encoder. It runs on Linux, Mac and Windows and uses the same Open Source libraries as ffmpeg, mplayer/mencoder, xine, etc. While these programs are generic video handlers (with thousands of confusing configuration parameters to sustain this generalistic status) HandBrake is optimized only for ripping so it is very easy to use, yet extremely powerful.


#!/bin/bash

##
## This is the script I use to make hifi DVD rips including chapter markers and
## subtitles. It uses Handbrake.
## Contains what I found to be the best quality ripping parameters and
## also let me set simple parameters I need.
##
## Avi Alkalay <avi at unix dot sh>
## http://avi.alkalay.net/2008/03/mpeg4-dvd-rip.html
##
## $Id$
##

#set -vx

HANDBRAKE=${HANDBRAKE:=~/bin/HandBrakeCLI}
#HANDBRAKE=${HANDBRAKE:="/cygdrive/c/Program Files/Handbrake/HandBrakeCLI.exe"}
## Where is the Handrake encoder executable.
## Handbrake is the most practical free, OSS, DVD riper available.
## Download HandBrake for Linux, Mac or Windows at http://HandBrake.fr


INPUT=${INPUT:=/dev/dvd}
## What to process. Can also be a mounted DVD image or simply '/dev/dvd'


TITLE=${TITLE:=L}
## The title number to rip, or empty or "L" to get the longest title


#CHAPTERS=${CHAPTERS:=7}
## Example: 0 or undefined (all chapters), 7 (only chapter 7), 3-6 (chapters 3 to 6)


#VERBOSE=${VERBOSE:="yes"}
## Wether to be verbose while processing.


SIZE=${SIZE:=1200}
## Target file size in MB. The biggest the file size, the best the quality.
## I use to use from 1000MB to 1400MB for astonishing high quality H.264 rips.


OUTPUT=${OUTPUT:="/tmp/output.mkv"}
## Output file. This will also define the file format.
## MKV (Matroska) is currently the best but MP4 is also good.


AUDIO=${AUDIO:="-E ac3 -6 dpl2 -D 1"} # For AC3 passthru (copy).
#AUDIO=${AUDIO:="-E lame -B 160"} # For MP3 reencoding. Good when input is DTS.
## Audio parameters. If input is AC3, use it without transcoding.
## If is DTS, reencode to MP3.


MATRIX=${MATRIX:=`dirname $0`/eqm_avc_hr.cfg}
## x264 matrix to use. The matrix file may increase encoding speed and quality.
## This one is Sharktooth's as found
## at http://forum.doom9.org/showthread.php?t=96298

######### Do not change anything below this line ##############


## Make some calculations regarding title and chapters based on parameters.
SEGMENT=""
if [[ "$TITLE" == "L" || -z "$TITLE" ]]; then
	SEGMENT="-L"
else
	SEGMENT="-t $TITLE"
fi

[[ -n "$CHAPTERS" && "$CHAPTERS" -ne 0 ]] && SEGMENT+=" -c $CHAPTERS"

[[ "$VERBOSE" != "no" ]] && VERB="-v"



# Define args for the x264 encoder. These are some values I found on the net
# which give excelent results.
X264ARGS="ref=3:mixed-refs:bframes=6:b-pyramid=1:bime=1:b-rdo=1:weightb=1"
X264ARGS+=":analyse=all:8x8dct=1:subme=6:me=umh:merange=24:filter=-2,-2"
X264ARGS+=":ref=6:mixed-refs=1:trellis=1:no-fast-pskip=1"
X264ARGS+=":no-dct-decimate=1:direct=auto"
[[ -n "$MATRIX" ]] && X264ARGS+=":cqm=$MATRIX"


# Encode...
"$HANDBRAKE" $VERB -i "$INPUT" -o "$OUTPUT" \
	-S $SIZE \
	-m $SEGMENT \
	$AUDIO \
	-e x264 -2 -T -p \
	-x $X264ARGS


# Repackage to optimize file size, to include seek and to include this
# this script as a way to document the rip...
echo $OUTPUT | grep -qi ".mkv"
if [[ $? && -x `which mkvmerge` && -f $OUTPUT ]]; then
	mv $OUTPUT $OUTPUT.mkv
	mkvmerge -o $OUTPUT $OUTPUT.mkv \
		--attachment-name "The ripping script" \
		--attachment-description "How this movie was created from original DVD" \
		--attachment-mime-type application/x-sh \
		--attach-file $0

	[[ -f $OUTPUT ]] && rm $OUTPUT.mkv
fi

The script seems long because it is fully documented but it actually only collects some parameters and simply runs the HandBrake encoder like this (passed parameters are in red):


~/bin/HandBrakeCLI -v -i /dev/dvd -o /tmp/output.mkv \
    -S 1200 \
    -m -L \
    -E lame -B 160 \
    -e x264 -2 -T -p \
    -x ref=3:mixed-refs:bframes=6:b-pyramid=1:bime=1:b-rdo=1:weightb=1:analyse=all:8x8dct=1:subme=6:me=umh:merange=24:filter=-2,-2:ref=6:mixed-refs=1:trellis=1:no-fast-pskip=1:no-dct-decimate=1:direct=auto:cqm=~/src/randomscripts/videotools/eqm_avc_hr.cfg

All the rest is what I found to be the best encoding parameters.

The resulting video file (/tmp/output.mkv in this case) will contain correctly cropped video and audio quality as good as the DVD (it is almost lossless), and chapter breaks at the same positions read from the DVD.

In a Core Duo machine as my laptop running Fedora 8 or Windows XP, a 2 pass H.264 encoding (2 pass improves quality and H.264 is newer standard MPEG-4 technology better than DivX/Xvid) takes about 4 to 5 hours for a regular 2 hours movie, so leave it encoding while you go to sleep. A Pentium 4 machine running Ubuntu takes about 17 hours for the same rip.

I use to rip one chapter from the movie first (use your preferred video player or lsdvd command to find the shortest chapter), check quality, compare to DVD, fine tune, try again and then shoot full DVD ripping.

After encoding I use to repackage the audio/video stream with Matroska‘s mkvmerge (or mmg, its GUI version available on any Linux distribution as “mkvtoolnix” package, and installable for Windows or Mac OS from Matroska’s website) to optimize seeks and to include soft subtitles (that can be turned on and off as on regular DVDs), but I’ll explain that in another HOWTO.

Give Your Ripped Movie a Descriptive File Name

I use to organize my media library in a standard way I invented for myself and which I suggest you to use too.

My movie file names shows everything that the file includes. Some examples:

  • Indiana_Jones_and_The_Raiders_of_the_Lost_Ark_IMDB{tt0082971}-Xvid{720x304_23.98fps}+MP3{ENG,POB_VBR}+Sub{ENG,SPA,POB}+Covers.mkv
    This is the Indiana Jone’s Raiders of the Lost Ark movie, whose IMDB index is tt0082971 (IMDB{tt0082971}). It was ripped with the old Xvid codec and contains 720×304 pixels frame size at a rate of 23.98 frames per second (Xvid{720x304_23.98fps}). It also contains selectable audio tracks in English and Brazilian Portuguese encoded in variable bit rate MP3 (MP3{ENG,POB_VBR}). In addition, there is also selectable subtitles in English, Spanish and Brazilian Portuguese (Sub{ENG,SPA,POB}). The file also contains the cover images as attachments.
  • Harold_and_Maude_IMDB{tt0067185}-H264{672x368_3Pass_25fps}+HEAAC{EN}+Sub{POR,EN,FRE}+Chapters+Covers.mkv
    The old Harold and Maude movie whose IMDB index is tt0067185 (IMDB{tt0067185}). It is encoded with H.264 in 3 passes and has 672×368 pixels frame size at a rate of 25 frames per second (H264{672x368_3Pass_25fps}). There is only one English audio track encoded in modern HE-AAC (HEAAC{EN}). Subtitles in Portuguese, English and French (Sub{POR,EN,FRE}), chapter information and attached cover images. This is very complete high quality DVD backup.
  • I_Am_Legend_IMDB{tt0480249}-H264{704x304_23.98fps}+AC3{ENG_5.1}+Sub{POR}.mkv
    The I Am Legend movie whose IMDB index is tt0480249 (IMDB{tt0480249}), video encoded in H.264 with 704×304 pixels frame size (H264{704x304_23.98fps}), original 5.1 channels AC3 audio in English (AC3{ENG_5.1}) and subtitles in Portuguese (Sub{POR}).

The advantages of this scheme are:

  • It is web safe with no spaces in filenames. All underlines. It is also DOS safe.
  • To have the IMDB index let me know exactly which movie this file contains. This is particularly good to avoid ambiguity for movies that have remakes as Ben Hur, or movies that have an official name but are well known by other names or have international titles.
  • To know the encoding method, subtitles included and chapters info give me the overall quality of the movie right away.
  • Special attention to audio and subtitle languages. Having them on the filename let me know I will understand its content without having to play. Sometimes I can’t play the file because I logged in my home computer remotely.

Playing the Ripped File

To play this advanced Matroska media file that contains such a rich set of metainformation and highly compressed digital content you will need an advanced player too. And happens that the best players are the Open Source ones. So use these players:

These are Media Player Classic screenshots demonstrating how to activate the advanced content inside a Matroska file. Players on other platforms have similar capabilities and menus.

Activating embedded subtitles and languages
The player lets you choose the audio language and subtitles. On MPC for example, this is how you turn on and off and choose the language for subtitles.
Choosing subtitles language

As you can see, the player found subtitles embedded in the MKV file in English, Hebrew and Portuguese.

If the MKV file contains many audio tracks (as different languages, director’s comments etc) this is how to select it:

Selecting audio track to play in Media Player Classic

And to jump directly to a specific chapter on the movie, if the MKV file contains this kind of information:

Using Media Player Classic to browse chapter in a movie file

Improving audio volume
If you ripped the movie without reencoding the audio, the final file will contain DVD’s original AC3 audio tracks in 6 channels (5+1). This may sound with a lower volume when played in a 2-speaker system as your laptop, iPod, etc because 4 channels are simply not being played. To remediate this the player will have to downsample the audio. In other words, it will remix the 6 channels into 2 stereo channels while playing. The Media Player Classic options should look like this:

Selecting Media Player Classic\'s Audio Options

Configuring audio downsample on Media Player Classic

Primeiro dia de BRM do OOXML e Violência em Genebra

Não estou em Genebra, no Ballot Resolution Meeting do OOXML na ISO, mas falei pelo Google Talk com o Deivi do Serpro que é chefe da delegação brasileira, e em linhas gerais me contou o seguinte:

A delegação brasileira pediu para que eu tirasse as informações do ar para evitar problemas na ISO. O Jomar vai publicar algumas informações no blog dele.

Bob Sutor também publicou umas palavras.

A violência ficou para o sábado que antecedeu a reunião. Deivi saiu de um pub a noite para caminhar e foi atacado do nada por uns rapazes. Tomou um soco no rosto que lhe quebrou o maxilar. Fernando Gebara deu o maior apoio mas terá que ficar 6 semanas sem poder mastigar nada, nem o chocolate e queijo suiços que tanto prometeu degustar na viagem.

E agente achando que não há violência nas ruas da Europa…

Índice Linux Journal, Janeiro de 2008

  1. Receita de Linux da Novell, em milhões de dólares, no últimos 9 meses reportados: 100
  2. Aumento em porcentagem do anterior em relação ao ano fiscal passado: 243
  3. Número de metros quadrados do laboratório da aliança Microsoft-Novell: 232
  4. Receita da Red Hat, em milhões de dólares, no último trimestre reportado: 127.3
  5. Aumento em porcentagem representado pelo anterior: 28
  6. Porcentagem de computadores em escolas russas em que Linux será instalado até 2009: 100
  7. Número de computadores Linux na biblioteca pública Takoma Park, Maryland: 28
  8. Milhares de vezes que pessoas se logaram em tais computadores no último ano: 40
  9. Porcentagem de mercado de Linux em PCs conectados à Internet em janeiro de 2006: .29
  10. Porcentagem de mercado de Linux em PCs conectados à Internet em dezembro de 2006: .37
  11. Porcentagem de mercado de Linux em PCs conectados à Internet em setembro de 2007: .81
  12. Porcentagem da taxa de crescimento do mercado de Linux em PCs conectados à Internet em 2007, até agora: 219
  13. Milhões de dólares investidos em Linux e companhias Open Source por empresas de venture capital no terceiro trimestre de 2007: 77.8
  14. Milhões de dólares investidos em Linux e companhias Open Source por empresas de venture capital do primeiro ao terceiro trimestre de 2007: 226.7
  15. Milhões de dólares que a Citrix pagou pela XenSource (virtualização Open Source) em agosto de 2007: 500
  16. Milhões de dólares que o Yahoo pagou pela Zimbra (e-mail e colaboração Open Source) em setembro de 2007: 350
  17. Posição de “Faça Ubuntu laptops mais baratos que Windows laptops (em todos os países)” entre as mais populares idéias do Dell IdeaStorm: 1
  18. Posição de “Faça Linux e nenhum sistema operacional opções padrão em todos os futuros produtos” entre as mais populares idéias do Dell IdeaStorm: 2
  19. Posição de “Coloque Ubuntu na lista de sistemas operacionais quando construir um PC!” entre as mais populares idéias do Dell IdeaStorm: 3
  20. Número de resultados de uma busca por “linux” em dell.com: 648

Fontes

  • 1–5: CNET.com
  • 6: CNews Russian IT Review
  • 7, 8: Phil Shapiro in PCWorld.com
  • 9–12: NetApplications.com, via Datamation
  • 13, 14: The 451 Group, via InternetNews.com
  • 15, 16: InternetNews.com
  • 17–19: DellIdeaStorm.com em 11 de Outubro de 2007
  • 20: Dell.com em 11 de Outubro de 2007

Por Doc Searls. Original: http://www.linuxjournal.com/article/9925#mpart1

Anúncio de Abertura de Formatos e Padrões da Microsoft

Teve um remelexo hoje na indústria de TI quando a Microsoft fez seu anúncio “interoperability by design”.

Gato escaldado tem medo de água fria…

Quem se lembra da promessa de portar o Internet Explorer para Solaris? Cadê? Bem, não que agente estivesse esperando por isso, nem precisasse…

E da promessa de abrir o .NET? Falando nisso, pra que reinventar a roda com .NET quando Java já estava bombando no mercado de desenvolvimento de aplicações comerciais? Simplesmente porque — é o que a história nos mostrou — não está no DNA dessa empresa trabalhar de forma cooperativa, num esquema ganha-ganha.

Esse anúncio agente tem que contextualizar no tempo e no espaço. O tempo é 2 dias úteis antes da reunião da ISO que vai decidir o destino do OOXML como padrão. E usuários estão percebendo que seus documentos não são realmente deles e sim do dono da ferramenta que os lê e grava, o que se traduz em indignação. Então o espaço é de aperto, o aperto dos acionistas da Microsoft que pediram mais ética.

Da análise técnica do OOXML aprendi que aquilo não foi exatamente “desenhado para interoperabilidade”. As víceras tiveram que ser abertas na marra porque a vantagem do ODF era periclitante.

Em face de todos esses fatos do passado, esse anúncio, por enquanto, não passa de marketing.

Mas vamos esquecer o passado e ser otimistas. Se a Microsoft realmente estiver a fim de mudar, isso deve ser recebido de braços abertos. A Web nos ensinou que quanto mais gente colaborar melhor ela fica. Não é diferente no mundo dos padrões e tecnologias. Então Microsoft, seus clientes, programadores, concorrentes, comunidade de software livre e o mercado em geral só tem a ganhar se tanto otimismo se pagar.

Vou me manter otimista e esperar agora por ações práticas, porque o blablablá nós já ouvimos. E foi ± isso que eu disse na entrevista ao IDG.

ODF in the State of Paraná

The state of Paraná, here in Brazil, is the first to have laws that specifically promotes the use of OpenDocument Format. This is a free translation of such law:

  1. All public companies and institutions under the state of Paraná administration will adopt, preferably, open formats for creation, storage and public availability of digital documents.
  2. We understand open formats as the ones that:
    1. promote interoperability between multiple applications and platforms, internal and externally;
    2. let users chose applications free from royalties;
    3. can be freely and independently implemented by multiple computer software vendors, in multiple platforms, without any charge for the intellectual property of the technology.
  3. The companies cited in point 1 must be enabled for receiving, publishing, visualization and preservation of digital documents in open formats according to norm ISO/IEC 26300:2600 (OpenDocument format – ODF).

This law was signed by Roberto Requião, the state gorvernor, and Nizan Pereira Almeida, secretary for strategic initiatives.

Other states in Brazil, inspired by Paraná, are creating similar laws.

Folks related to the ODF initiative in Paraná

The folks in the photo, left to right, are: Henrique Menezes, government relations, IBM. Jomar Silva, ODF Alliance chapter Brazil. State congressman Edson Praczyk. Vitorio Furusho, Celepar (a state public company), BrOffice.org users group and Open Source Movement in Paraná. Reginaldo Radel, congressman Prazyk assistent.

Linux e ODF no Banco do Brasil

Logo do Banco do BrasilEssas reuniões do grupo de trabalho da ABNT servem também para encontrar velhos amigos e um deles foi o Penna do Banco do Brasil, um dos responsáveis pela adoção em massa de Linux na empresa.

Contou que 100% das agências tem seus servidores rodando Linux. 100% dos caixas de atendimento. E a grande maioria dos PCs de atendimento personalizado.

Contou que por volta de 2004 e 2005 tudo rodava sobre OS/2 e havia a necessidade iminente de sair dessa plataforma. Mas grande parte do trabalho de porte das aplicações já havia sido feito em Linux pela equipe técnica.

Migrou-se então.

Apesar de terem ainda muitos documentos legados em formatos proprietários, o uso de BrOffice.org é praticamente universal e um departamento precisa ter um motivo que justifique a compra de qualquer outra suite de escritório. Na minha opinião, BrOffice.org é gratuito e bom o suficiente a ponto de o Banco do Brasil (ou qualquer empresa) poder ser chamada de financeiramente irresponsável se não o considerar.

A partir daí, como todo funcionário tem BrOffice.org em seu PC mas nem todos tem outra suite paga, o formato de documentos que circula tem que ser algo universal. E há algo mais universal que ODF?

Certa vez o Penna me contou também que pegaram um Sharp Zaurus (PDA que roda Linux) e recompilaram as aplicações da agência para rodar nele. Sim, eles montaram uma agência de demonstração com um PDA como seu servidor, só pra mostrar a portabilidade e que é simplesmente possível.

RIO D’JANEIRO É NOSSOOOO !!!!!!!!!!1111

Quando o Brasil votou NÃO ao OOXML em agosto, anexou também sessenta e tantos comentários justificando o porquê dessa rejeição. Muitos países fizeram o mesmo, inclusive alguns que votaram SIM.

Desde novembro a ECMA tem respondido a esses comentários em forma de alterações e melhorias a especificação OOXML para remediar os problemas apontados. O Grupo de Trabalho instaurado pela ABNT que esteve analisando essas respostas terminou seu trabalho hoje e foi um sucesso. A reunião aconteceu no Rio de Janeiro.

Semana que vem acontece a reunião final da ISO em Genebra onde os países terão chance de discutir as respostas da ECMA, quais aceitaram e quais não resolveram problemas de interoperabilidade, padronização etc do OOXML. O Brasil vai levar as seguintes resoluções:

  • De fato vários problemas principalmente editoriais foram resolvidos e as modificações propostas pela ECMA foram aceitas.
  • Há ainda diversos problemas de inconsistência como multiplos formatos de datas não padronizados e que chocam entre sí.
  • Há problemas de interoperabilidade: um documento OOXML pode conter trechos binários cujo formato do conteúdo não é aberto nem está especificado. Exemplo:
    <o:ink i="AMgFHQSWC+YFASAAaAwAAAAAAMA...">
  • Há problemas de interoperabilidade com itens “deprecated”, ou seja a especificação suporta sub-formatos proprietários antigos junto com novos para coisas do tipo representação de funções matemáticas, desenhos vetoriais etc. Neste ponto, a posição do Brasil é de que só deve entrar na especificação ítens “deprecated” que não se pode converter automaticamente, por exemplo, de .DOC para .DOCX.
  • Outros aspectos relacionados a falta de documentação na especificação.

A somatória desses ítens por enquanto mantém o voto do Brasil: NÃO ao OOXML.

Além disso, o grupo varreu e classificou também diversos comentários de outros países — e suas respectivas respostas da ECMA — para que a delegação brasileira possa argumentar quando esses pontos forem discutidos na reunião da ISO.

O trabalho do grupo foi excelente, de alto nível, pragmático e saudável. E por isso eu gostaria de agradecer e rasgar a seda:

Fernando Gebara da Microsoft que coordenou as reuniões, fez o “trabalho sujo” de documentação, agendar calls, administrar portais, wikis etc, manteve a neutralidade técnica que sem ela todo o trabalho teria empacado na guerra ideológica. Jomar Silva da ODF Alliance, o Homembit, que foi o catalisador e hub de toda a comunidade livre nessa empreitada, além de mergulhar de cabeça na missão técnica. Deivi Kuhn do SERPRO que se envolveu em cada detalhe e mereceu ser o chefe da delegação a Genebra. Marisa Rublescki do SERPRO também superenvolvida, responsável e dona de um olhar clínico para debulhar especificações gigantescas. Murilo Barreto do Banco do Brasil, pela dedicação e magia negra contra sua agenda apertada. Daniel Assad e Leandro Jekimim, da facção da UNESP a favor do OOXML, por trazerem argumentos técnicos para a discussão. Cezar Taurion da IBM, articulador, blogueiro, evangelista e fonte de inspiração para todos. E tantos outros que trabalharam na linha de frente ou retaguarda para esse trabalho sair, um muito obrigado.

Como essa reunião era do comitê que trata de padrões de documentos, foi feita também uma deliberação para acelerar a aprovação do ODF como o padrão brasileiro de documentos. E, na verdade por causa disso, RIO D’JANEIRO É NOSSOOOO !!!!!!!!!!1111

PS: O Jomar publicou mais alguns detalhes, alguns bem irônicos. Confira.

Ted Tso Quer Brasileiros Trabalhando no LSB

Ted TsoAcabei de tomar um café com o Theodore Tso (blog), um dos jedi master hackers do universo Linux e Open Source de todos os tempos.

Acontece que ele trabalha na IBM a alguns anos e atualmente está num assignment temporário na Linux Foundation (a mesma casa do Linus Torvalds) focado em melhorar o framework LSB, que padroniza as distribuições Linux do ponto de vista das aplicações.

Ele está no Brasil por alguns dias entrevistando talentos, especialmente estudantes, para trabalharem com ele nessa empreitada. Um trabalho que deve ser prá lá de divertido também pela quantidade de interações com celebridades da comunidade Linux.

Boa sorte aos que conseguirem sua vaga na Linux Foundation !

Web 2.0 Party

Web 2.0 is about people. Its a global party where human beings exchange knowledge, experiences, information and even emotions.

Yesterday I saw the Xanadu movie again with ELO’s All Over the World, a good-vibe song from the 80’s that still has very current lyrics that explain what people are doing in our 2008’s Web 2.0.

Check out the movie excerpt with the song and the lyrics.

Everybody all around the world
Gotta tell you what I just heard
There’s gonna be a party all over the world

I got a message on the radio
But where it came from I don’t really know
And I heard these voices calling all over the world

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

Everybody walkin’ down the street
Everybody movin’ to the beat
They’re gonna get hot down in the U.S.A.
(New York, Detroit, L.A.)

We’re gonna take a trip across the sea
Everybody come along with me
We’re gonna hit the night down in gay Pareee

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

London, Hamburg, Paris, Rome, Rio, Hong Kong, Tokyo
L.A., New York, Amsterdam, Monte Carlo, Shard End and

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

Everybody all around the world
Gotta tell you what I just heard
Everybody walkin’ down the street
I know a place where we all can meet
Everybody gonna have a good time
Everybody will shine till the daylight

All over the world,
Everybody got the word
Everybody everywhere is gonna feel tonight

All over the world
Everybody got the word
All over the world
Everybody got the word
All over the world
Everybody got the word

Ditados Populares Atualizados

Recebi isso por e-mail e achei bem oportuno, e um barato.

  1. A pressa é inimiga da conexão
  2. Amigos, amigos, senhas à parte.
  3. Antes só do que em chats aborrecidos
  4. Arquivo dado não se olha o formato
  5. Diga-me qual a sala de chat que você freqüenta e te direi quem és!
  6. Para todo bom provedor uma senha basta.
  7. Não adianta chorar sobre o arquivo deletado.
  8. Em briga de namorados virtuais, não se mete o mouse!
  9. Em casa de programador, o espeto é de par trançado
  10. Em terra off-line, quem tem 486 é rei!
  11. Hacker que ladra, não morde!
  12. Mais vale um arquivo no HD do que dois baixando…
  13. Mouse sujo se limpa em casa!
  14. Melhor prevenir que formatar.
  15. O barato sai caro e lento…
  1. Programa velho é que faz site bom…
  2. Quando a esmola é demais, o santo desconfia que veio algum vírus anexado!
  3. Quando um não quer dois não teclam!
  4. Quem ama um 486, Pentium 4 lhe parece!
  5. Quem clica seus males multiplica!
  6. Quem com vírus infecta, com vírus será infectado!
  7. Quem envia o que quer, recebe o que não quer!
  8. Quem não tem banda larga, caça com modem!
  9. Quem nunca errou, que aperte a primeira tecla!
  10. Quem semeia e-mails, colhe SPAM!
  11. Quem tem dedo vai a Roma.com !
  12. Um é pouco, dois é bom, três é chat!
  13. Vão-se os arquivos e ficam os back-ups!
  14. Vírus no winchester dos outros é refresh!

OOXML Tem Nome Inapropriado

Vejam esta conversa com uma agente de marketing e comunicações, por mensagem instantânea:

  • Ela: Recebemos a ligação de um jornalista da ###### dizendo que a IBM apoia o padrão XML porque os programaa IBM Lotus Quikr , IBM Websphere Portal , IBM DB2 9 XML suportam XML… vc sabe dizer se é verdade ? E se sim, porque fazemos isso ?
  • Eu: XML é um padrão universal de todos… com certeza apoiamos! Mas acho que ele quis dizer “Office OpenXML” da MS.
  • Ela: isso… quer dizer que estes produtos suportam XML não OPEN XML da MS ? é isso ? entendi certo ?
  • Eu: sim… todo mundo suporta XML… mas “Office Open XML” só a MS suporta
  • Ela: ah….
  • Eu: se “XML” fosse um “meio de transporte genérico”, então “Office OpenXML” seria um “Gol GL 1.6”.
  • Ela: ahah… essa foi boa

Ou seja, tem muita gente trocando as bolas entre XML e OpenXML, especialmente gente que tem acesso a mídia.

Índice Linux Journal, Dezembro de 2007

  1. Porcentagem mínima do tráfego da Internet identificado como ponto-a-ponto (peer-to-peer): 50
  2. Porcentagem máxima do tráfego da Internet identificado como ponto-a-ponto (peer-to-peer): 90
  3. Porcentagem mínima do tráfego ponto-a-ponto que usa BitTorrent: 50
  4. Porcentagem máxima do tráfego ponto-a-ponto que usa BitTorrent: 75
  5. Porcentagem de americanos entrevistados que acreditam que a constituição estabelece uma nação cristã: 55
  6. Número de vezes a palavra “Christian” (Cristão) aparece na constituição: 0
  7. Número de vezes a palavra “God” (Deus) aparece na constituição: 0
  8. Número de vezes a palavra “liberty” (liberdade) aparece na constituição: 3
  9. Número de vezes a palavra “freedom” (liberdade) aparece na constituição: 1
  10. Milhões de récordes de estudantes belgas gerenciados por uma suite de gerência de processo de negócio (business proccess management suite, BPMS): 1
  11. Milhares de escolas envolvidas no BPMS belga: 3
  12. Milhares de clientes da Intalio, o criador open-source do BPMS belga: 10
  13. Preço da ação da SCO em centavos no dia em que fez o pedido de falência: 37
  14. Milhões de dólares que a Rackspace vai investir no novo sede em San Antoni: 100
  15. Milhares de novos empregados que a Rackspace pretende contratar em sua nova sede: 4
  16. Milhares de hostnames servidos pelos datacenters da Rackspace: 920
  17. Número de anos que a Rackspace está no radar da Netcraft com seus web servers Linux: 11
  18. Porcentagem de mainframes IBM System z que se calcula rodarem cargas de Linux: 25
  19. Porcentagem de disconto no preço do System z especializado para rodar Linux: 90
  20. Número de servidores que a IBM está consolidando em 30 mainframes System z rodando Linux no projeto Big Gree: 3900

Fontes

  • 1, 2: Ipoque.com, sourced by ArsTechnica.com
  • 3, 4: Ellacoya Networks, sourced by ArsTechnica.com
  • 5: First Amendment Center
  • 6–9: USConstitution.net
  • 10–12: Intalio, Inc.
  • 13: TheStreet.com
  • 14–17: Netcraft.com
  • 18, 19: searchenterpriselinux.com
  • 20: IBM

Por Doc Searls. Original: http://www.linuxjournal.com/article/9890#mpart1

Índice Linux Journal, Novembro de 2007

  1. Velocidade média medida em MBps de uma conexão de banda larga com velocidade de download de “até 8Mbps”: 2.7
  2. Menor velocidade medida em MBps de uma conexão de banda larga com velocidade de download de “até 8Mbps”: 90
  3. Quantos, entre 5 consumidores, recebem a velocidade de banda larga contratada: 1
  4. Porcentagem de consumidores pesquisados que se sentiram desorientados pelas propagandas dos provedores: 30
  5. Bilhões de usuários de Internet em 2006: 1.1
  6. Usuários de Internet adicionais esperados até 2010, em milhões: 500
  7. Milhões de streams de vídeo servidos por dia pelo YouTube: 100
  8. Número de câmeras de segurança em Londres: 200
  9. Trilhões de bits enviados pelas câmeras de segurança de Londres aos seus data centers: 64
  10. Terabytes acumulados por dia pela Chevron: 2
  11. Número total de exabytes em dados em 2006: 161
  12. Múltiplo em milhões do total de dados de 2006 para toda a informação em todos os livros jamais escritos: 3
  13. Porcentagem do universo digital que vai ser criado por individuais em 2010: 70
  14. Porcentagem do universo digital corrente que está sujeita a regras de compliance e padrões: 20
  15. Porcentagem do universo digital corrente que está potencialmente sujeita a aplicações de segurança: 30
  16. Exabytes de “conteúdo criado pelo usuário” projetado para 2010: 692
  17. Total de exabytes de dados projetados para 2010: 988
  18. Porcentagem do universo digital de 2010 no qual organizações serão responsáveis por segurança, privacidade, confiabilidade e compliance: 85
  19. Capacidade em exabytes de mídia pronta para armazenar dados novos e replicados no universo digital de 2010: 601
  20. Ano em que a quantidade de informação criada vai ultrapassar a capacidade de storage disponível pela primeia vez: 2007

Fontes

  • 1, 2: which.co.uk, sourced by David Meyer for ZDNet UK
  • 3, 4: moneysupermarket.com, sourced by David Meyer for ZDNet UK
  • 5–20: “Expanding the Digital Universe”, by John F. Gantz, et al., a March 2007 IDC whitepaper

Por Doc Searls. Original: http://www.linuxjournal.com/article/9871#mpart1

Índice Linux Journal, Outubro de 2007

  1. Quantos dólares a mais um Dell Inspiron 1420, baseado em Linux, custa comparado ao mesmo rodando Vista, antes do erro ter sido corrigido: 225
  2. Quantos dólares a menos um Dell Inspiron 1420, baseado em Linux, custa comparado ao mesmo rodando Vista, depois do erro ter sido corrigido: 50
  3. Preço base corrigido de um notebook Dell 1420 Inspiron rodando Ubuntu: 774
  4. Número de opções de cores para o 1420: 8
  5. Porcentagem de computadores revitalizados pelo Alameda County Recycling Center (ACCRC) que rodam Linux: 100
  6. Preço cobrado pelo ACCRC para receber qualquer computador: 0
  7. Preço cobrado pelo ACCRC para receber “qualquer coise que você possa conectar na tomada” que não seja grandes dispositivos não-computacionais e monitores e TVs: 0
  8. Preço em centavos cobrado por libra por receber monitores e TVs: 50
  9. Milhares de sistemas rodando Linux com suporte dados pelo ACCRC por ano: 1
  10. Milhares de novos sites rodando Apache encontrados pelo Netcraft em sua pesquisa de julho de 2007: 556
  11. Milhares de novos sites do Google encontrados pelo Netcraft em sua pesquisa de julho de 2007: 592
  12. Milhões de novos sites Microsoft encontrados pelo Netcraft em sua pesquisa de julho de 2007: 2.4
  13. Porcentagem do Apache de todos os sites ativos pesquisados pelo Netcraft: 49.98
  14. Porcentagem de Microsoft de todos os sites ativos pesquisados pelo Netcraft: 35.48
  15. Porcentagem do Google de todos os sites ativos pesquisados pelo Netcraft: 4.35
  16. Porcentagem do Google de todos os sites ativos pesquisados pelo Netcraft em julho de 2006: 0
  17. Vantagem na porcentagem do Apache comparado a Microsoft em julho de 2006: 33.4
  18. Vantagem na porcentagem do Apache comparado a Microsoft em julho de 2007: 14.5
  19. Porcentagem de desenvolvedores norte-americanos de olho em Linux em 2007: 11.8
  20. Crescimento percentual do anterior comparado a 2006: 34

Fontes

  • 1–3; 18–20: DesktopLinux.com
  • 4–7: APPC (www.accrc.org)
  • 8: ZaReason, Inc.
  • 9–17: Netcraft.com

Por Doc Searls. Original: http://www.linuxjournal.com/article/9768#mpart1

Índice Linux Journal, Setembro de 2007

  1. Dólares gastos pela nike em seu logotipo swoosh: 35
  2. Bilhões de dólares gastos em marketing no ano passado pela Nike: 1.7
  3. Porcentagem de web sites que são pornográficos: 12
  4. Porcentagem de requisições por pornografia em mecanismos de busca: 25
  5. Porcentagem de pornografia em todos os downloads: 35
  6. Número de usuários vendo pornografia por segundo: 28358
  7. Dólares americanos gastos em pornografia a cada segundo: 89
  8. Número de novos sites de pornografia surgindo todos os dias: 266
  9. Bilhões de páginas web estimadas: .372
  10. Posição de “sex” entre as palavras mais procuradas: 1
  11. Renda em 2006 proveniente de pornografia na Internet, nos EUA, em bilhões de dólares: 2.84
  12. Porcentagem masculina dos usuários de pornografia na Internet: 72
  13. Porcentagem de tráfego de pornografia durante as 8 horas úteis do dia: 70
  14. Porcentagem de sites de pornografia produzidos pelos EUA: 89
  15. Posição do AdultFriendFinder entre os sites de pornografia mais populares: 1
  16. Número de sites AdultFriendFinder acompanhados pelo Netcraft: 75
  17. Número de sites AdultFriendFinder que sabe-se serem servidos por Desconhecido: 46
  18. Número de sites AdultFriendFinder que sabe-se serem servidos por Windows: 1
  19. Número de sites AdultFriendFinder que sabe-se serem servidos por BSD: 2
  20. Número de sites AdultFriendFinder que sabe-se serem servidos por Linux: 28

Fontes

  • 1–15: Good Magazine
  • 16–20: Netcraft.com

Por Doc Searls. Original: http://www.linuxjournal.com/article/9786#mpart1

Tecnologia Orgânica

Numa cobertura do evento CES no caderno Link do Estadão, entre um monte de matérias sobre as novas tralhas tecnológicas apresentadas lá, há uma nota tímida sobre as bizarricies do evento.

Uma delas é uma bateria ou pilha que é recarregada com líqüidos tipo saliva ou urina.

Uma ótima invenção, de um gênero que deveria ser cada vez mais incentivado !

Porque afinal, toda essa mobilidade eletrônica e digital que a gente gosta cobra seu preço ao meio ambiente.

Diga-se de passagem, isso me lembrou as stillsuites do fictício universo de Duna (livro e filme): roupas especiais que capturam e reciclam a umidade do corpo de quem a veste, para serem usadas em ambientes inóspitos como o planeta-deserto Duna.

Deslizes e Tentáculos ao redor do OOXML

Algumas notas da blogosfera:

  • Roberto Salomon, do BrOffice.org e IBM, faz questão de lembrar quem são os verdadeiros donos dos documentos .doc, .ppt e .xls. O Service Pack 3 do MS Office 2003 simplesmente proibe um usuário abrir versões antigas desses formatos por serem declarados inseguros. Jomar também monta em cima e manda sua letra. Salomon discute muitas coisas interessantes ao redor da guerra de padrões em seu blog.
  • E o mesmo Salomon comenta com citações que o OOXML “é uma simples questão de interesses comerciais”, segundo a Microsoft.

Google Maps com Posicionamento por Antenas de Celular

Já faz um tempo que tenho me divertido com a nova versão do Google Maps que se instala no celular.

Ele faz uma coisa incrível: te diz mais ou menos onde você está agora, mesmo se seu celular não é equipado com GPS. É um recurso que se chama “My Location”.

Me falaram que a técnica que usada para fazer isso chama-se triangulação de antenas. Parece que é conhecida a posição geográfica de cada antena de celular e o Google Maps sente a potência de cada antena próxima e calcula a posição aproximada de acordo com a força do sinal de cada uma delas.

No mapa abaixo, estou realmente no ponto mais ao sul mas o Google Maps do meu celular calculou que estou um pouco mais ao norte, ponto este que vejo de minha janela a uns 100m mais ou menos.

Center of map
map
Estou realmente aqui
map
O Google Maps calculou que estou aproximadamente aqui

É bastante bom para eu que não tenho GPS.

Já disse antes e continuo repetindo: o Google Maps é o serviço mais legal da Web. Mais ainda que o Google Earth por ser mais acessível e leve.

O mapa desta página é feito com o Google Maps plugin para WordPress.

Mobile Codes começam a ser usados no Brasil

Já contei aqui no blog o que são Mobile Codes (ou QR Codes) e o drebes comentou que no Japão são muito usados.

Mas nunca vi ninguém usar isso aqui no Brasil. Até hoje.

No caderno Link do Estadão de hoje apareceu uma propaganda de um varejista de eletrodomésticos contendo um QR Code e uma chamada para o site descubraocodigo.com.br.

Entrando no site não há nenhuma informação útil. Mas se você ler o código da propaganda com um celular com câmera e software que interpreta Mobile Codes, surge uma URL escondida contendo promoções da loja.

Como isso é uma coisa nova ainda no Brasil, parece que o varejista está inteligentemente usando a tecnologia para criar um certo hype em torno dela.

Com a disseminação desses códigos, eles serão usados para se comunicar de forma física e impressa diretamente com os avatares digitais de uma sociedade da informação: seus computadores móveis, também conhecidos por “telefone celular”.

Software Security from a Specialist: Gary McGraw

I just listened to an excellent interview with Gary McGraw, a security guru, in the Software Engineering Radio, and I suggest software developers to hear it too.

Some points he touched:

  • Software security is about how to approach computer security if you are a developer or a software architect.
  • Security problems come from 2 points: (a) bad or buggy implementation as buffer overflows etc and (b) lack or poor architectural risk analysis. So even if you took a lot of care while writing the code you may have forgotten completely to authenticate users. This is a bad design (b) issue. Both problems — implementation and design — must be mitigated.
  • You can’t be 100% secure, but if you have considered security in the design and in the implementation of your software, you will be a lot better than simply shipping software without thinking about security.
  • Although people may have very good reasons to think that Open Source software is less secure than closed source because a cracker can see the code and find flaws, the bad guys actually use the binary version of a software to find the flaws, using low level debuggers, stack analyzers, decompilers and other kinds of things. Open Source software is not really in any worse shape that any other kind of software. He also says that Open Source software is not also better, from a security perspective. He does not believe in that theory that everybody is looking at the code and may find and fix bugs. Me neither.

I guess this is my last post of 2007 and I wish everybody a happy new year.

A Blogosfera

Um blog é um website qualquer cujo conteúdo é organizado como um diário (log, em inglês), ou seja, por datas e em ordem cronológica. O nome surgiu quando “web log” virou “weblog”, que em uma brincadeira se transformou em “we blog”, para enfim se popularizar em “blog”.

A cultura dos blogs tem um dicionário de jargões:

  • Post: um artigo ou publicação que pode conter texto, imagens, links, multimídia, etc. Um post tem um título, data e hora, é categorizado sob um ou mais assuntos como “vinhos”, “tecnologia”, “viagens”, “poesia”, etc., definidos pelo dono do blog. Usa geralmente linguagem mais direta e descontraída, e pode ser tão longo quanto um extenso artigo, ou conter somente poucas palavras. Um blog é uma seqüência de posts.
  • Comentário: visitantes do blog podem opinar sobre os posts, e esse é um lado muito importante da interatividade dos blogs.
  • Permalink: um link permanente, o endereço direto de um post específico.
  • Trackback e Pingback: um post que faz referência a outro post, até mesmo em outro blog.
  • Feed: há ferramentas que permitem ler vários blogs de forma centralizada, sem ter que visitá-los separadamente. O feed é uma versão mais pura do blog, contendo somente os últimos posts em formato XML (RSS ou ATOM), e serve para alimentar essas ferramentas. Podcasts nada mais são do que feeds contendo mídia, ao invés de só texto.

Blog é um nome mais atual para o que se costumava chamar de “home page”. A diferença é que antes da era dos blogs, uma pessoa que quisesse ter um website pessoal, tinha um enorme trabalho para publicar conteúdo de páginas, que geralmente eram estáticas, não interativas, e francamente, sem graça. Era um processo manual que exigia algum conhecimento técnico, e por isso eram geralmente os técnicos que publicavam conteúdo na web.

Com a padronização do conteúdo em ordem cronológica, em posts, surgiram uma série de ferramentas e serviços de blogging, sendo os mais conhecidos o WordPress, Blogger, LiveJournal e MovableType.

Eles facilitaram a publicação de textos, links, multimídia, de forma organizada e bonita, e a web ficou muito mais interessante. Se antigamente um escritor precisava ter influência com editoras para publicar trabalhos, hoje qualquer pessoa é um escritor em potencial. E, sim, os blogs revelaram inúmeros ótimos escritores — alguns viraram celebridades —, só porque agora eles tem acesso a uma plataforma de publicação independente e direta: a Internet.

Os “blogueiros” (bloggers, pessoas que possuem e escrevem em seus blogs) visitam e lêem outros blogs, fazem comentários, criam links e se referenciam, criando uma espécie de conversa distribuída.

A consolidação da cultura dos blogs fez surgir alguns serviços como Technorati, Truth Laid Bear, BlogBlogs, Ping-o-matic, Digg, dentre outros, que tem a habilidade de seguir a conversa. Mais ainda, eles conseguem medir a popularidade de um blog ou de um assunto, e mensurar sua vitalidade e popularidade na web. Usando extensamente idiomas XML como XHTML, RDF, RSS e ATOM, eles conseguem notificar um blog de que ele foi citado em outro blog, ajudando o primeiro a publicar automaticamente um pingback ou trackback, mostrando quem o citou e como.

A Blogosfera é o fenômeno sócio-cultural materializado nessa malha de interações digitais entre os blogs e seus autores. Pode ser comparada a Comunidade de Software Livre. Onde esta cria software de forma distribuída e de acesso livre e direto aos usuários finais, a Blogosfera trabalha com idéias em geral, poesia, fotografia, multimídia, notícias, de qualquer um que se disponha a escrever para qualquer um interessado em ler.

Como dizem Doc Searls e David Weinberger no artigo Mundo de Pontas (“World of Ends”), a Internet é uma grande esfera oca com a superfície formada por pontas interconectadas. Bem, nós somos as pontas e ela é oca porque não há nada no meio que limite a nossa interação. Essa metáfora explica como os bloggers ganharam voz ativa na sociedade livre da Internet, onde falam bem de quem gostam e denunciam quem ou o que não gostam. Sendo público e interativo, qualquer assunto verídico e bem conduzido tem potencial para virar uma bola de neve ao ponto de iniciar um escândalo político (exemplo), obrigar uma empresa a admitir que deve fazer um recall de produtos defeituosos, ou de dar informações muito precisas sobre a bomba que explodiu no bairro durante uma guerra (warblog).

O Software Livre, a Blogosfera e outros movimentos socioculturais que estão por vir são um resultado direto da benéfica massificação da Internet.

Empresas têm usado blogs como forma de se aproximarem de seus clientes. Sua linguagem descontraída, não-institucional e principalmente interativa derruba barreiras e potencializa comunidades. Bons blogs corporativos passaram a ser peça chave do ciclo de desenvolvimento de produtos, como plataforma de divulgação das próximas novidades e ponto de coleta direta de opiniões de usuários.

O que você está esperando para ingressar na Blogosfera ?

OOXML é Incompatível com Formatos Anteriores

É importante enfatizar que a Microsoft anda dizendo que o OOXML é bom e necessário porque garante compatibilidade com o formato anterior (.doc etc).

Isso é uma imprecisão grosseira que cai bem nos ouvidos de quem não é técnico ou quem não pára pra pensar o que isso significa.

Explico: O .doc e companhia são formatos binários (ilegivel aos olhos humanos), e o OOXML é um formato baseado em XML (texto puro comprimido). Só este fato faz com que seja impossível haver compatiblidade entre os dois formatos. Dessa perspectiva, OOXML é mais compatível com ODF do que com .doc e companhia.

O que sim pode ser compatível com .doc e OOXML ao mesmo tempo é a suite de escritório MS Office, um programa que lê e escreve esses formatos — e que pode fazer o mesmo com ODF. Mas a guerra toda é sobre os formatos e não sobre programas, certo !?.

OOXML — o formato — não é compatível com nada anterior a ele, e agradeceria se pessoas influentes (mas imprecisas) parassem de achar e dizer que é.