dermeister
Ent cara-de-pau
então dermeister, você comentou sobre a forma da tua resistência, mas não o motivo dela. pq exatamente vc não quer de jeito nenhum que facebooks, googles e afins (megacorps) façam o mapeamento de dados sobre vc?
É suficiente dizer que são as minhas informações? Coisas triviais, os sites que visito, matérias que leio, etc. podem ficar comigo mesmo. Mesmo que não sejam nada fora do convencional, gosto de tratar como privado por padrão.
Para não ficar só no exemplo do FB, saiba que eu não navego conectado aos serviços sociais "grandes" (Google, Youtube, Twitter, etc.) que usam esses modelos de captura silenciosa de informações. Sério. E nem é difícil, só exige algum cuidado técnico.
Por exemplo: Em casa eu raramente acesso o email pela web mas um cliente desktop, que é muito mais prático, porém frequentemente uso alguma coisa do Google Docs (não uso ele para documentos *meus*, mas sim para aqueles que acabo compartilhando e editando em conjunto). No passado eu usava perfis diferentes do Firefox para cada coisa mas, como alguns esses serviços funcionam melhor com o Chromium (não uso o Chrome), acabei mudando de estratégia e abro uma instância dele só para conectar às coisas do Google, faço o que precisa ser feito, desconecto e apago (automaticamente) as informações persistentes (cookies, local storage, etc). É uma estratégia parecida com a que uso no trabalho: meu email pessoal fica aberto em uma instância dedicada e isolada do Chromium, enquanto as outras atividades ficam em um Firefox. Assim não preciso manter um cliente de email sincronizando por IMAP e dá uma boa separação entre os domínios pessoal e profissional. Usar exclusivamente Linux em casa e no trabalho tem muitas vantagens.
Outro exemplo de paranoia saudável quanto ao email, ainda que não relacionada ao problema: não deixo emails arquivados no servidor por muito tempo. Tenho todos os emails que troquei nos últimos 14 anos salvos aqui (mas não os de listas de discussão; exceto por listas de projetos que desenvolvo, desses só mantenho os enviados), mas apago-os do servidor depois de uns três meses -- isso não impede o data-mining pelos fornecedores (o Google provavelmente mantém os emails para isso), mas evita que um eventual comprometimento da minha senha dê ao atacante acesso a anos e anos de emails meus.
Outros cuidados dos meus cuidados triviais: forçar o navegador a tratar todos os cookies como cookies de sessão, bloquear cookies de terceiros, não permitir que o Flash salve os cookies dele, Flashblock, AdBlock com minhas regras, isolação entre instâncias do navegador, etc.
Cuidados dos meus cuidados são mais complexos e voltados a cenários diferentes dos tratados aqui incluem: usar contas de usuário (locais, no micro) separadas para teste de software, só rodar coisas suspeitas em VMs e usar critptografia completa de disco no notebook -- completa mesmo, incluindo swap e hibernação. O objetivo é evitar que um eventual ladrão tenha acesso aos meus dados. Ele ele for roubado, eu ficarei fulo pela perda de um bom note mas dormirei tranquilo porque o ladrão não terá acesso à nenhuma informação minha guardada lá.
por outro lado, tem todo aquele lance do barateamento do serviço: há uns 15 anos, por exemplo, e-mail normalmente era um serviço pago.
Fato, mas sem entrar na Síndrome de Númenor ("Tudo era melhor no passado"), essa situação era melhor porque o email não era tão concentrado em um número tão pequeno de provedores quanto hoje. Distribuição e independência são
Para os curiosos, eu uso um domínio próprio apontando para o Google Apps -- assim posso trocar de fornecedor caso o Google torne-se desvantajoso sem ter que trocar de endereços no processo. Isso vale para meu GTalk também (que, para os tecnicamente orientados, é um Jabber com extensões e é distribuído. Espero que o Google não resolva fechar a rede).
de acordo com os TOS deles, a tua identificação continua anônima (embora seja tecnicamente viável chegar na tua identidade real através de métodos estatísticos, depois procuro o link pra fonte), mas eles negociam sim as informações que vc gera. eles NÃO PODEM vender o seguinte vetor: {dermeister, valinor, não tem redes sociais}, mas podem vender o seguinte: {x, valinor, não tem redes sociais} (na verdade, estou assumindo como se dermeister fosse a tua identificação real ). concordo com vc: é fácil, em qualquer das duas situações, chegar no dermeister, se este for o objetivo.
Na verdade, eles podem fazer essa associação sim. Usando aquele mecanismo do conteúdo carregado com cookies de terceiros + conluido do site de origem, é possível associar o site visitado ao seu perfil, que tem seu nome real e outras informações. O mesmo vale para os serviços do Google, todos integrados: ter acesso a essas informações é uma das grandes razões por trás do Google Plus, eles estavam perdendo feito para o FB nesse campo. O ponto é que todo o processo pode ser automatizado e as informações coletadas são guardadas indefinidamente e distribuídas aleatoriamente.
Ah, termos de uso não valem nada nesse caso. Prefiro tratar o problema tecnicamente
Acho que o método estatístico que você citou é um envolvendo comparação de grafos, não? Faz uns anos que li um paper sobre isso, mas não lembro exatamente.
e não é isso bom? hoje vc tem twitter, facebook, gmail, instagram, etc etc. todos serviços de difusão de informações, e gratuitos para o usuário. todos baseados nos mesmos princípios.
Não exatamente gratuitos, né? Pagamos por esse serviço vendo propaganda e dando nossas informações. Nesse modelo de negócio, usuários são o produto (mas já é clichê dizer isso).