Resumo: O presente trabalho pretende analisar a representação do sujeito de referência indefinida em sentenças finitas do português brasileiro (PB) em amostras de escrita padronizada (a partir dos estatutos das academias literárias brasileiras do século XVIII), de escrita jornalística e de fala especializada, focando na passagem do século XIX ao século XX, quando, conforme Tarallo (1993) e Pagotto (1998), entre outros, assistimos à emergência de uma gramática brasileira. O objetivo é mostrar que, em relação à representação do sujeito indeterminado, o fenômeno possa se considerar um reflexo da mudança paramétrica respeito ao parâmetro Pro-Drop (PB como língua Pro-Drop parcial), cuja consequência é uma mudança na representação dos sujeitos pronominais de referência definida. Ao longo do século XX, observou-se no PB a implementação na representação do sujeito indeterminado (genérico e arbitrário) de formas pronominais nominativas expressas (Você e a gente) em detrimento do uso das formas padronizadas para a indeterminação do sujeito: SE (3PS), 3PP∅ e da 1PPmos. Todavia, apesar dessa implementação, em gêneros textuais orais e escritos [+monitorados], se oscila ainda entre uma gramática mais inovadora e uma gramática mais conservadora, apresentando ainda formas que estão em desuso ou são pouco utilizadas na fala.
Palavras-chave: Sujeitos indeterminados, referência arbitrária, referência genérica, parâmetro pro-drop, variação morfossintática.
Abstract: This paper aims to analyse the representation of the indeterminate subject in Brazilian Portuguese (BP) finite sentences in samples of standardised writing (based on the statutes of the 18th century Brazilian literary academies), journalistic writing and specialised speech, focusing on the transition from the 19th to the 20th century, when, according to Tarallo (1993) and Pagotto (1998), among others, we saw the emergence of a Brazilian grammar. The aim is to show that, with regard to the representation of the indeterminate subject, the phenomenon can be considered a reflection of the parametric change with regard to the Pro-Drop parameter (BP as a partial Pro-Drop language), the consequence of which is a change in the representation of pronominal subjects with definite reference. Throughout the 20th century, the representation of the indeterminate subject (generic and arbitrary) in BP was implemented using express nominative pronominal forms (Você and a gente) to the detriment of the use of standardised forms for indeterminate subjects: SE (3PS), 3PP∅ and 1PPmos. However, despite this implementation, in oral and written textual genres [+monitored], it still oscillates between a more innovative grammar and a more conservative grammar, still presenting forms that are in disuse or little used in speech.
Keywords: Indeterminate subjects, arbitrary reference, generic reference, null subject parameter, morphosyntactic variation.
Artigo
O sujeito indeterminado em sentenças finitas do português brasileiro
The indefinite subject in Brazilian Portuguese finite sentences
Received: 03 July 2024
Revised document received: 13 September 2024
Accepted: 21 August 2024
Published: 01 September 2024
O presente artigo pretende analisar a representação do sujeito de referência indefinida em sentenças finitas do português brasileiro (PB) em amostras de escrita padronizada e de fala especializada, focando na passagem do século XIX ao século XX, quando, conforme Tarallo (1993), entre outros, assistimos à emergência de uma gramática brasileira.
O objetivo é mostrar que, em relação à representação do sujeito indeterminado, se passa de um emprego, quase prevalente, de duas estratégias (3PP, sem explicitação do sujeito, e o clítico SE), nos séculos XVIII/XIX, a um emprego de mais estratégias, com uma implementação de formas pronominais nominativas, nos séculos XX e XXI, e que esse fenómeno possa se considerar um efeito colateral da mudança paramétrica respeito ao parâmetro pro-drop (PB como língua pro-drop parcial), cuja consequência principal é uma mudança na representação dos sujeitos pronominais de referência definida. Estudos recentes sobre a representação de sujeitos de referência indeterminada no português brasileiro (PB) evidenciaram a preferência por formas pronominais nominativas de referência genérica1 e arbitrária2, preferencialmente expressas, nas sentenças finitas da fala culta urbana, da fala divulgativa e semidivulgativa web-mediated, da fala popular e a implementação de emprego dessas formas inovadoras em sentenças finitas na escrita padrão (Kato e Tarallo 1986; Duarte 1993, 1995, 2000, 2007, 2012; Cavalcante 1999, 2007; Duarte e Lopes 2002; Duarte, Kato e Barbosa, 2003; Couto, 2005; Vargas, 2010, 2012; Marins, Soares da Silva e Duarte, 2017; Amaral e Mihatsch, 2023; Avelar, 2023; De Rosa e Desantis, no prelo).
O declínio progressivo do emprego de estratégias standard de indeterminação do sujeito nas variedades cultas urbanas do PB (PB neo-standard)3 – SE indefinido (apassivador/indeterminador) e 3PP com sujeito nulo – e o aparecimento e a implementação de estratégias de indeterminação inovadoras e alternativas – formas nominativas (preferencialmente expressas): VOCÊ, A GENTE, NÓS e ELES4 – deve ser considerado um efeito colateral, conforme Weinreich, Labov e Herzog (2006, p, 110), da mudança do parâmetro do sujeito nulo (Chomsky 1981, 1995). Com essa mudança, que não afeta o PB standard, o PB neo-standard passaria de língua pro-drop a língua pro-drop parcial (Kato, 1999).5 De fato, se o português europeu (PE) e o PB standard podem ser consideradas línguas positivamente marcadas para o parâmetro pro-drop, apresentando uma preferência para sujeitos nulos, tanto de referência definida quanto de referência indeterminada, o PB neo-standard apresenta uma preferência pelo preenchimento da posição de sujeito com formas pronominais.
Com base no exposto e tendo como referência teórica a teoria da mudança linguística proposta por Weinreich, Labov e Herzog (2006), associada à teoria dos Princípios e Parâmetros (Chomsky 1981, 1995), propomos fazer um levantamento das estratégias de indeterminação do sujeito no PB, ao longo dos séculos XVIII, XIX, XX e XXI, em amostras do Discurso Institucional [+monitorado] e do Discurso Especializado web-mediated e comparando os nossos resultados com os resultados de Cavalcante (1999) e de Duarte (2007).
A hipótese principal que orienta nossa análise é a de que, dependendo da tipologia de amostra e do período analisado, devemos encontrar, pelo que se refere à representação de sujeitos de referência indeterminada, uma gramática mais conservadora, com uma preferência pelo uso de estratégias standard, na amostra de escrita academicista (século XVIII); uma gramática mais ou menos conservadora nas análises de escrita jornalística (séculos XIX e XX) e uma gramática levemente menos conservadora na amostra de transcrições dos Academic talk videos (século XXI).
No parágrafo 2 (e em seu subparágrafo), apresentaremos a classificação do fenômeno de indeterminação do sujeito na perspectiva das Gramáticas Tradicionais Normativas; no parágrafo 3 (e seus subparágrafos) falaremos sobre a emergência de uma gramática brasileira entre os séculos XIX e XX; no parágrafo 4, traremos os resultados obtidos na amostra do século XVIII e do século XXI, comparando-os com os resultados de Duarte (2007) e Cavalcante (1999), em suas respectivas pesquisas (nesse momento faremos alguns comentários acerca dos estudos); as conclusões são uma síntese crítica dos resultados.
No século XIX, período em que se consolidam grandes mudanças de natureza sintática e emerge uma gramática brasileira (Tarallo, 1992; Pagotto, 1998), acontecem, entre outros, dois fatos muitos importantes, o primeiro, em 1826, quando
José Clemente propôs que os diplomas dos médicos no Brasil fossem redigidos em ‘linguagem brasileira’, e o segundo, em 1827, quando ‘houve um grande número de discussões sobre o fato de que os professores deveriam ensinar a ler e a escrever utilizando a gramática da língua nacional’
(Guimarães, 2005, p. 25).Isso revela que no parlamento brasileiro se sentia a necessidade de formular a questão da língua nacional do Brasil.
Nas gramáticas normativas portuguesas e brasileiras, fala-se de sujeito indeterminado quando “o verbo não se refere a uma pessoa determinada, ou por se desconhecer quem executa a ação, ou por não haver interesse no seu conhecimento” (Cunha & Cintra, 1985, p. 128).
A Gramática Tradicional (GT) indica como únicas estratégias para a representação de sujeitos de referência indeterminada em sentenças finitas:
a 3PP com sujeito não expresso (1 e 2), com verbos transitivos diretos;
o clítico SE+3PS com verbos transitivos indiretos (3), verbos intransitivos (4) ou verbos transitivos diretos com uso intransitivo (5) ou a coocorrência das duas estratégias (6):
De fato, na tradição gramatical luso-brasileira (Cunha e Cintra, 1985, pp. 128-129; Bechara, 1977, p. 200; Rocha Lima, 1972, pp. 236; Mateus et alii, 2003, p. 283) se indicam quase exclusivamente essas duas estratégias, às quais Bechara (1977, p. 200) acrescenta a 3PS com sujeito não expresso, mas limitada ao verbo dizer: “ø Diz que eles vão bem” e Inês Duarte (2003, p. 283) acrescenta, para o PE, a 2PSgen com pronome não expresso “ø Ajudas sempre os amigos e apesar disso eles criticam-te”.
Quanto à classificação do clítico SE com verbos transitivos diretos (3PS e 3PP), a gramática normativa considera o “SE” como um apassivador. Sendo assim, tratando-se de uma passiva sintética (ou passiva pronominal), esta não é incluída nas estratégias de indeterminação do sujeito:
alugam-se casas
*aluga-se casas
Todavia, são diversos os autores, entre os quais Bechara (2004), que inserem também o clítico SE com verbos transitivos diretos, ‘com’ ou ‘sem’ concordância, entre as estratégias de indeterminação do sujeito:
[O] se como índice de indeterminação de sujeito – primitivamente exclusivo em combinação com verbos não acompanhados por objeto direto –, estendeu seu papel aos transitivos diretos (onde a interpretação passiva passa a ter uma interpretação impessoal: Vendem-se casas = ‘alguém tem casa para vender’) e de ligação (É-se feliz). A passagem deste emprego da passiva à indeterminação levou o falante a não mais fazer concordância, pois o que era sujeito passou a ser entendido como objeto direto, função que não leva a exigir o acordo do verbo: Vendem-se casas (= ‘casas são vendidas’) → Vendem-se casas (= ‘alguém tem casa para vender’) → Vende-se casas
(Bechara, 2004, p. 178).Outros autores, como Antenor Nascentes (1938), Said Ali (1965) e Mattoso Câmara Jr. (1976), afirmam que as construções com o clítico SE com verbos transitivos diretos não devem ser consideradas de sentido passivo. Raposo (2020, p. 2477) conclui “que essas construções são ativas, funcionando o pronome se como sujeito”. Às mesmas conclusões chegam Raposo e Uriagereka (1996, p. 800), que designam a passiva sintética como SE indefinido.
Scherre (2005, p. 80) afirma que “[a] forma verbal nas estruturas denominadas passivas sintéticas é variável e ocorre, segundo a tradição por ‘atração ou por falsa concordância com o objeto direto’” (...) em função do conhecimento da gramática normativa da língua portuguesa”, assim como Peres e Móia (1995, pp. 234-235), que consideram ambas as construções, com e sem concordância entre o verbo e o seu argumento interno, aceitáveis. Também Duarte (2013, p. 447) afirma que, na 3PS, o SE apassivador e o SE indeterminador compartilham o traço de indeterminação.
Por conseguinte, no que diz respeito à nossa análise, seguindo Egerland (2003), Marins, Soares da Silva e Duarte (2017) e Holmberg e Phimsawat (2017), dividimos as estratégias de indeterminação em três grupos diferentes, considerando as estratégias mais conservadoras e as mais inovadoras:
3PParb/excl SE+3PP e o pronome ELES, preferencialmente expresso no PB neo-standard; (exclui o locutor);
3PS+/-gen +/-incl SE+3PS, Ø+3PS e o pronome VOCÊ, preferencialmente expresso; (pode incluir ou não o locutor e o alocutário);
1Pgen/semi-incl os pronomes EU, NÓS e A GENTE, com a forma pronominal A GENTE em considerável vantagem sobre a forma NÓS no PB neo-standard. (inclui necessariamente o locutor, mas pode incluir ou não o alocutário)
Nessa tripartição, tivemos em conta a referência arbitrária, que exclui o locutor, a referência genérica, que inclui o locutor (Egerland 2003) e a inclusão, semi-inclusão ou a exclusão do alocutário (Holmberg e Phimsawat 2017).
Em 1826, o deputado José Clemente propôs que os diplomas dos médicos no Brasil fossem redigidos em “linguagem brasileira”. Em 1827, houve muitas discussões sobre o fato de que os professores deveriam ensinar a ler e a escrever utilizando a gramática da língua nacional. De uma certa forma, o que emerge é que até a independência, nunca se cogitou uma questão relativa a um standard, a uma norma brasileira. De fato, foi só com a independência que “questões relativas à modernização do país, à educação dos cidadãos e à definição de uma identidade brasileira começaram a se colocar” (Duarte, 2023, p. 32).
A questão da língua portuguesa no Brasil, que já era língua oficial do Estado, se põe a partir desse momento como uma forma de transformá-la de língua do colonizador em língua da nação brasileira, de língua madrasta a língua materna, com a sobreposição da língua oficial e da língua nacional.
No parlamento brasileiro, surge a questão sobre qual deveria ser o modelo de língua a ser adotado na escrita nacional. Deveria a escrita refletir as características da fala culta brasileira ou seguir o padrão escrito lusitano, estabelecido durante a primeira fase do Romantismo em Portugal? A solução escolhida foi conservadora, visando um discurso de unidade absoluta: o PB deveria se alinhar ao PE, ignorando as diferenças e tomando como referência os escritores lusitanos. Assim, na primeira metade do século XIX, começou a se estabelecer oficialmente no Brasil o fenômeno da diglossia, onde havia uma discrepância entre o que os brasileiros (mesmo os mais letrados) falavam e como deveriam escrever.
Pagotto (1998; 2011) revela essa atitude conservadora e unificadora, comparando a mudança de norma standard utilizada na redação dos textos das duas Constituições do século XIX, a do Império, de 1824, e a da República, de 1891. Da primeira para a segunda, observa-se uma nítida mudança em direção a uma gramática que possui mais características em comum com o português europeu moderno, descartando tanto os traços considerados conservadores quanto as inovações brasileiras presentes na Constituição do Império7. Essa questão linguística ligada à procura de uma norma brasileira se torna urgente no começo do século XX, assim como confirmam as palavras que Mário de Andrade escreve, entre 1924 e 1929, no Prefácio do seu projeto editorial A Gramatiquinha da Fala Brasileira:
O que se dá é que o português comum quando escreve, escreve o que aprendeu nas gramáticas e que ele fala todo o dia, enquanto o brasileiro se vê obrigado a abandonar o que fala todo o dia pra se lembrar das regras da gramática que mecanicamente aprendeu na escola e de que pouco se utilizou
(Andrade, [2022], p. 16)Quanto às inovações brasileiras, Tarallo (1993), diagnosticando a emergência de uma gramática brasileira no século XIX, destaca quatro casos de diferenciação e distanciamento entre as duas variedades nacionais da língua portuguesa: o PE e PB, que observamos a seguir:
- a re-organização do sistema pronominal que teve como conseqüências mais importantes a implementação de objetos nulos no sistema brasileiro de um lado, e sujeitos lexicais mais freqüentes de outro (...);
- a mudança sintática ocorrida nas estratégias de relativização como conseqüência direta da mudança no sistema pronominal (...);
- a re-organização dos padrões sentenciais básicos (...) e, diretamente relacionado a esta ordem SVO rígida em estado de emergência à época, o enrijecimento do princípio de adjacência na marcação do acusativo (...);
- e uma quarta mudança no sistema brasileiro, diretamente ligada às três anteriores, será apresentada como evidência cabal de que os dois sistemas continuam a distanciar-se um do outro: os padrões sentenciais em perguntas diretas e indiretas
(Tarallo, 1993, p. 70).Dos quatro traços destacados por Tarallo, é o primeiro que mais interessa para o nosso estudo, ou seja, a reorganização do sistema pronominal com a implementação de sujeitos lexicais. De fato, a pronominalização da forma alocutória VOCÊ e a sua inserção no sistema pronominal (sincretismo da 2PS e 3PS e da 2PP e da 3PP) revelam o processo de mudança no que diz respeito à representação do sujeito pronominal. No PB há uma preferência pela realização fonética do sujeito, em decorrência da redução do paradigma flexional do verbo (de 6 a 3/4 formas), conforme a hipótese de Duarte (1993, 1995). Isto quer dizer que estamos diante de uma mudança na marcação do Parâmetro do Sujeito Nulo, de língua pro-drop a língua pro-drop parcial, cuja consequência principal é uma mudança na representação (e na realização morfo-fonética) dos sujeitos pronominais de referência definida e cujo efeito colateral é uma implementação também de formas pronominais nominativas de referência indefinida (genérica e arbitrária).
Nesta seção, descrevemos os pressupostos metodológicos que irão orientar nossa análise. Decidimos analisar o emprego das estratégias de indeterminação em variedades diamésica escritas e transmitidas em gêneros totalmente diferentes, mas altamente monitorados, ao longo dos séculos XVIII-XXI. Para o século XVIII, analisamos a escrita de três estatutos acadêmicos; para os séculos XIX-XX, usamos os resultados das análises de Cavalcante (1999) e de Duarte (2007) sobre a escrita jornalística e para o século XXI usamos uma amostra de fala especializada web-mediated (Academic talk videos), que faz parte do Corpus I-Fala (De Rosa, 2010).
Entre os documentos que fazem parte da produção acadêmica do século XVIII, foram selecionados apenas três documentos de natureza não ficcional, caracterizados por um alto grau de monitoramento estilístico e formalidade: Estatutos da Academia Brasílica dos Esquecidos, de 1724, Estatutos da Academia Brazílica dos Acadêmicos Renascidos, de 1759, e Estatutos Da Sociedade Literária Do Rio De Janeiro, de 1786. Esses documentos foram produzidos em um contexto linguístico altamente supervisionado, de modo que a sintaxe frasal e os fenômenos gramaticais nos textos em questão deveriam ser afetados o mínimo possível pelos usos pessoais dos autores.
No primeiro documento, Estatutos da Academia Brasílica dos Esquecidos (1724), encontramos apenas 9 ocorrências, devido também ao fato que a “Notícia da Fundação” não passa de duas páginas. Se trata de dois casos de SE+3PP e de sete casos de SE+3PS. Vejam-se os exemplos:
(1) “Tomaram por matéria principal de seus estudos a· História Brasílica dividida em quatro partes, a natural que corre por conta do já nomeado chanceler, a militar que searb encarregou ao Douto Juiz de Fora, a eclesiástica cujo emprêgo searb deu ao Reverendo Gonçalo Soares da Franca, e a política cuja incumbência caiu em sorte ao Ouvidor Geral do Cível.” (Castello, 1969, vol. I, t. 1, p. 3)
(2) “Ficou por estatuto que em obséquio dos engenhos poéticos searb dariam para tôdas as conferências dois argumentos ou assuntos, um heróico, outro lírico.” (Castello, 1969, vol. I, t. 1, p. 4)
No segundo documento, Estatutos da Academia Brazílica dos Acadêmicos Renascidos (1759), o número de ocorrências é bem superior, chegando a um total de 114 ocorrências. De fato, esse documento foi escrito em dois momentos distintos: o primeiro, em 2 de junho de 1759 e composto por 61 itens e 20 parágrafos e o segundo, em 21 de julho de 1759 e composto por quatro parágrafos e três itens.
Nesse documento, além de encontrar 72 ocorrências de SE+3PS:
(3) “Vagando lugar numerario segen elegerá para elle por escrutinio um dos supranumerarios” (Estatutos..., 1882, p. 53)”,
e 41 ocorrências de SE+3PP:
(4) “O director prezidirá em todas as conferencias, que searb fizerem no seu ano. (Revista IHBG, 1882, p. 53)”,
encontramos também uma ocorrência de Ø+3PP:
(5) “Todos os quinze dias, principiando no segundo sabado depois de 13 de Maio, haverá uma conferencia no lugar, que destinaremarb para as particulares, ás quaes se ha de entrar pelas trez·horas da tarde” (Estatutos..., 1882, p. 61).
No entanto, o que despertou nossa atenção foi a identificação de uma construção altamente ambígua que apresenta todas as características de uma estrutura de indeterminação do sujeito Ø+3PS:
(6) “Sem a Historia, nem se temeria a infamia pela facilidade, com que Ø podia3PS esquecer, nem seria muito estimavel a gloria de emprehender as ações grandes, durando pouco tempo a lembrança das heroicidades” (Estatutos...,1882, p. 51).
Se trata de uma estratégia de indeterminação do sujeito que não é contemplada pela Gramática Tradicional, assim como as formas pronominais nominativas expressas (VOCÊ, A GENTE, NÓS e ELES). Essa estratégia é registrada apenas no português brasileiro contemporâneo, quase exclusivamente na linguagem falada. No entanto, devido ao fato de ser um fenômeno bastante recente, consideramos a possibilidade de que o primeiro “SE” na frase (“...nem se temeria a infamia...”) também governe a segunda estratégia de indeterminação e incluímos a ocorrência no computo das construções SE+3PS.
No terceiro documento, Estatutos Da Sociedade Literária Do Rio De Janeiro (1786), composto por 38 itens, encontramos 22 ocorrências de estratégias de indeterminação do sujeito.
As estratégias compreendem:
15 casos de SE+3PS:
(7) “A eleição de Secretário segen fará em plena Assembléia” (Castello, 1969, vol I, t. 6, p. 237);
6 casos de SE+3PP:
(8) “Nas matérias, que searb houverem de propor à Sociedade, deliberar, ou julgar, terá dois votos em caso de empate” (Castello, 1969, vol I, t. 6, p. 237);
e 1 caso de Ø+3PP:
(9) “Øarb ajuntarão as sortes compostas de bilhetes com os nomes de todos os Sócios (Castello, 1969, vol I, t. 6, p. 237).

Como se vê do gráfico, as duas estratégias SE+3PS e SE+3PP são as mais utilizadas, com a estratégia Ø+3PP que começa a aumentar em termos porcentuais, enquanto não foram encontradas estratégias de indeterminação do sujeito com formas pronominais nominativas.
Para os séculos XIX e XX, contemplamos a escrita jornalística que, no Brasil desses dois séculos, desempenhou um papel importante e, às vezes, até crucial. De fato, mais do que um meio de informação, midiática transmissão de mensagens, as publicações da época também eram um todo social, político e cultural que inovou e até fomentou debates públicos em torno de questões como liberdade, cidadania, direitos humanos e políticos veiculando essas questões através de uma norma mais padronizada. No século XIX, quando a maior parte da população do país ainda vivia sob o regime monárquico e a educação era um privilégio, a imprensa se tornou um dos principais locais para as vozes locais. O mesmo pode ser afirmado para o século XX, especialmente a segunda metade, quando o Brasil estava enfrentando seu processo de redemocratização e desfrutava de uma sociedade cada vez mais alfabetizada.
Por esta razão, as análises de Cavalcante (1999) e Duarte (2007) sobre o emprego de estratégias de indeterminação na escrita jornalística são muito relevantes para entender a evolução dessas estratégias na escrita mais padronizada.
No estudo de Cavalcante (1999), foram delimitados cinco períodos de tempo distintos: o Período I (1848-1869), que corresponde à estabilização do Império; o Período II (1891-1910), que corresponde à proclamação da República (1889); o Período III (1935-1942), que corresponde ao Estado Novo; o Período IV (1964-1968), que corresponde ao golpe militar e à primeira fase da ditadura e o Período V (1996-1998), que corresponde à fase mais recente da pesquisa e chega até o final do século XX.
Esses cinco períodos cruzam dois séculos fundamentais, conforme Pagotto (1998), para a formação de uma norma culta brasileira, de uma variedade mais padronizada utilizada também nos jornais: uma primeira fase, do final do século XIX até os anos 30, e uma segunda fase, a partir da segunda metade dos anos ’40.
No gráfico que segue, estão sintetizados os resultados da análise de Cavalcante (1999).
Como emerge nitidamente, há estratégias de indeterminação mais padronizadas, como o SE, 1PPmos e a 3PP, e estratégias menos padronizadas como A GENTE e VOCÊ.

As duas estratégias mais empregada na escrita jornalística ao longo dos cinco períodos são o SE e a 1PPmos, com essa última estratégia que, com uma curva descendente, passa de 47% do primeiro período a 17% do último período, enquanto o SE, com uma curva ascendente, passa de 46% do primeiro período a 62% do último período.
Duarte (2007) analisa o emprego de estratégias de indeterminação na escrita jornalística carioca (textos de opinião, crônicas e reportagens) com o objetivo de buscar evidências da implementação também na escrita mais monitorada de estratégias de indeterminação típicas da fala.

Nessa análise se confirma o fato de o clítico SE e a 1PPmos serem as estratégias mais utilizadas, mesmo se com posições invertidas, sendo o NÓS a estratégia mais empregada com 45% de ocorrências. Em analisar esses resultados, Duarte (2007, p. 106) evidencia que esses dois resultados mostram e demonstram a pressão normativa, sendo o SE uma estratégia muito distante do uso registrado nas variedades cultas urbanas mais monitoradas (tanto na fala, quanto na escrita) e a 1PPmos, com pronome preferencialmente nulo, uma estratégia que contraria a mudança paramétrica do PB que está se transformando em língua PRO-DROP parcial.
Enfim, as estratégias com VOCÊ e A GENTE, presentes tanto na amostra de Cavalcante (1999), quanto na amostra de Duarte (2007), começam a se implementar na escrita mais monitorada, mesmo se lentamente.
Para o século XXI, analisamos a fala especializada web-mediated, uma variedade diamésica transmitida (que oscila entre fala e escrita) altamente monitorada. A fala especializada web-mediated dos Academic talk videos da nossa amostra, sendo uma linguagem especializada (LSP), é identificada principalmente pela dimensão de variação diatemática - pelos conteúdos - e pela dimensão de variação diafásica - ligada à situação comunicativa e à relação entre locutor/speaker e destinatários - que leva à escolha de um determinado registro linguístico (dentro do continuum [+formal] [-formal]) ou de traços léxicos/sintáticos específicos. Todavia, sendo uma fala especializada web-mediated [+/-monitorada] e [+/-formal], a dimensão de variação diamésica, conforme o meio, o canal de transmissão utilizado e a modalidade de língua, resulta ser fundamental para poder analisar essa variedade linguística.
Para a análise da fala especializada utilizamos 27 trascrições de Academic talk videos extraídos do Corpus de Fala Acadêmica Monitorada PB-FAM.8 Os Academic talk videos são eventos comunicativos planejados, quase sempre de natureza monológica, nos quais o locutor pode utilizar recursos multimodais, mesmo se limitados às imagens, e uma LSP: a fala especializada web-mediated, que oscila entre um registro [+/-formal] (De Rosa, 2020a, 2020b). Essa variedade diamésica pode ser considerada uma LSP devido ao seu alto grau de especialidade e pelo fato de apresentar um léxico específico e especializado e modalidades próprias para a formação de neologismos ou para estruturar os textos.
Nessa amostra computamos 206 ocorrências. No gráfico que segue, evidenciamos a distribuição das estratégias de indeterminação do sujeito que consideramos na nossa análise: (ELES), SE+3PP, SE+3PS, (VOCÊ), Ø+3PS, (NÓS), (A GENTE), (EU),9 divididas por tipologia de Academic talk videos nas sentenças finitas.

Como se destaca no gráfico, as duas gramáticas, a conservadora e a inovadora, convivem na fala especializada semidivulgativa com as estratégias standard (SE+3P e ELES) que chegam a 34 em 206 ocorrências, com um índice de quase 17%.
A tal propósito, Duarte (2007, pp. 105-106) afirma que na escrita padrão a análise dos sujeitos de referência indeterminada “mostra que a escrita dos jornais brasileiros, nos gêneros focalizados, não se aproxima da fala; ao contrário, privilegia (...) o clítico se e as formas de primeira e 3ª pessoas do plural com o pronome preferencialmente nulo”. Isso se reflete também na nossa amostra, em que essas três estratégias juntas, SE+3P, ELES e 1PPmos, em desuso na fala, chegam a um índice de 33,4% (69 em 206 ocorrências). Vejam-se os exemplos:
(10) Esse gesto analítico que segen faz ao compreender uma formação discursiva...
(PBFAM-FF-VV8)
(11) Seja o Estado, pode-searb propor qualquer objetivo, mas o que o distingue de outras comunidades humanas é que ele faz uso legítimo da violência física, coisa que nenhuma outra comunidade humana poderia fazer.
(PBFAM-FF-OQI1)
(12) Mas, do ponto de vista eh... da... de como me Ø perguntamarb muitas vezes...
(PBFAM-FF-OQI7)
(13) Então, como, na verdade, Ø sustentamos as... as instituições políticas existentes...
(PBFAM-FF-OQI2)
Dentro de um contexto discursivo [+monitorado], como é o caso do Discurso Especializado semidivulgativo, ainda podemos encontrar vestígios da coocorrência entre as estratégias padrão ELES e SE+3PS (Vargas, 2012, p. 57), mesmo não estando em concorrência, não podendo se considerar intercambiáveis, porque não apresentam a mesma referência de indeterminação (Lunguinho e Medeiros Junior, 2009).
(14) …como Ø não disseramarb o que é que segen ganhou, quem é que ganhou…
(PBFAM-FF-VV1)
A tal propósito, é importante evidenciar que o clítico SE pode ter tanto referência genérica, quanto referência arbitrária, estando, nesse último caso, “em variação com o verbo na 3a pessoa do plural ou com o pronome nominativo ‘eles’ expresso e ainda com o verbo na 3a pessoa do singular sem qualquer marca” (Duarte et alii, 2021, pp. 158-159). Todavia, precisa evidenciar que, na nossa amostra, apenas 8 em 33 construções com o clítico SE apresentam referência arbitrária, isto é, 24% das ocorrências desse tipo de estratégia. Vejam-se os exemplos:
(15) ...a sintaxe passa a ter uma relevância no procedimento de análise que não tinha na “Análise automática” de 1969, onde searb produzia um processo de desintagmatização para a construção do objeto discursivo.
(PBFAM-FF-VV8)
(16) ...há duas, basicamente duas, interpretações fonológicas para as vogais do português, uma mais antiga, em que searb defende que o português apresenta 12 fonemas vocálicos...
(PBFAM-FF-LM4)
Os nossos dados confirmariam quanto já evidenciado em Lunguinho e Medeiros Jr. (2009) e em Marins, Soares da Silva e Duarte (2017), ou seja, que as duas estratégias standard não estariam mais em variação, em concorrência, mas seriam complementares na medida em que se especializaram a representar as duas referências opostas: genérica, o clítico SE, e arbitrária, ELES.
Como já apontamos, as formas pronominais que pertencem ao terceiro grupo (1P +/-plural) compartilham a referência genérica (incluindo necessariamente o locutor) e o traço semi-inclusivo (podendo incluir ou não o alocutário). Contudo, se a 1PPmos, mesmo sendo uma forma pronominal, resulta ser integrada num contexto discursivo [+monitorado], a forma pronominal A GENTE, inovadora quanto a forma VOCÊ, resulta ser ainda uma estratégia pouco empregada em gêneros discursivos escritos [+monitorados], mesmo que seu uso esteja se implementando.
Essa implementação do emprego da forma A GENTE, lenta e gradual nas variedades escritas [+monitoradas] do PB, se confirma na fala especializada semidivulgativa da nossa amostra onde chega a um emprego muito amplo com 96 em 206 ocorrências, com um índice de quase 47%. Contudo, apesar desse índice de emprego tão alto, não se trata de um uso exclusivo, de fato, a cada três ocorrências de A GENTE corresponde uma ocorrência da 1PPmos (nula ou expressa), como se destaca claramente no gráfico 3. Isso confirmaria, de um lado, que em um contexto discursivo [+monitorado], na escrita padrão e na fala especializada semidivulgativa, a 1PPmos continua sendo uma opção de indeterminação e, do outro, que, sendo a segunda opção da 1PP, “nós constitui a escolha para uma indicação mais definida, enquanto a gente pode efetuar uma referência mais indeterminada, mesmo que essa expressão continue sendo usada, claramente, em referência à primeira pessoa” (Ilari, Franchi, Neves e Possenti, 1996, p. 93). Entretanto, estes resultados não se refletem nos dados da fala espontânea, na qual, além de não se repetir a coocorrência e concorrência entre A GENTE e NÓS, a 1PPmos está em processo de extinção na fala dos <30 (Duarte, 1993, 1995). Vejam-se os exemplos:
(17) ela tem elementos que são fixos e aqui um local, né?, que a gente chama de slot.
(PBFAM-FF-LM2)
(18) Quando a gente se espanta diante do cotidiano e Ø percebe que as explicações
(PBFAM-FF-OQI4)
Pelo que se refere ao uso da 1PS, EU, que faz ainda parte do terceiro grupo, devido ao fato de ter encontrado apenas três ocorrências, não podemos tentar fazer algum tipo de generalização, sobretudo porque duas das três ocorrências são registradas no mesmo talk e podem ser consideradas mais como uma escolha estilística. Vejam-se os exemplos:
(19) “X-mente”, eu tenho “frequentemente”, “totalmente”, “claramente”, então no lugar do X aparece, pode aparecer qualquer adjetivo.
(PBFAM-FF-LM2)
Todavia, apesar do limite das três ocorrências, concordamos com Marins, Soares da Silva e Duarte (2017, p, 164), sobre o fato que o emprego de EU, da 1PS, torna a experiência mais real, pelo fato que o locutor/speaker “offers an example to the proposed situation in the discourse, (...) showing it could be lived by any person, including himself/herself, therefore limiting the generic reference.”
Ao segundo grupo, além do clítico SE+3PS, pertencem também a forma nominativa VOCÊ e o sujeito nulo indeterminado Ø+3PS. Essa última estratégia, assim como o clítico SE, pode apresentar tanto referência arbitrária, quanto referência genérica. Contudo, as quatro ocorrências presentes na nossa amostra apresentam referência genérica. A seguir os exemplos:
(20) para ser linguista, Øgen tem que fazer uma graduação, o mestrado, o doutorado, então, né? precisamos de uma área um pouco, de uma formação consolidada.
(PBFAM-FF-LM3)
(21) Acho que Øgen não pode pensar à política somente a partir do que alguns interpretam como a ciência política.
(PBFAM-FF-OQI8)
A última forma nominativa que analisamos é VOCÊ. Essa estratégia de indeterminação do sujeito – que apresenta uma referência genérica e inclusiva, sendo em origem uma forma alocutária – resulta ser a estratégia preferida pelos falantes brasileiros tanto na fala culta urbana, com índice de 44%, quanto na fala popular com índices entre 45% e 49% (Duarte, 2007, p. 103). Entretanto, nos Academic talk videos, principalmente pela tipologia de gênero textual monológico centrado no locutor, computamos apenas 33 em 206 ocorrências, com um índice de 16%. Vejam-se os exemplos:
(22) Então, a partir de agora, se alguém perguntar pra você se a sociolinguística é uma metodologia ou uma teoria, você já sabe dizer que ela é uma teoria e que tem, como qualquer outra teoria, uma metodologia própria pra fundamentar os seus princípios e as suas hipóteses.
(PBFAM-FF-LM6)
(23) Então qualquer gesto que você faça, qualquer ação que você faça, pode significar ou não.
(PBFAM-FF-VV9)
Todavia, se somarmos os dados relativos às duas formas nominativas mais inovadoras, ou seja, A GENTE (com 96 ocorrências) e VOCÊ (com 33 ocorrências), chegamos a 129 em 206 ocorrências, ou seja, um índice de 62%.
A análise dos dados que apresentamos confirma nossa hipótese inicial, isto é, na representação do sujeito indeterminado, se passa de um emprego:
quase prevalente, de duas estratégias (o clítico SE e a 3PP – nominativo e passivo com concordância), no século XVIII;
a um emprego de mais estratégias, com a presença de formas pronominais nominativas (ainda com índices baixos), no século XIX e no século XX nas amostras de escrita jornalística (Cavalcante, 1999; Duarte 2007), com uma prevalência de uso das estratégias mais padronizadas, com uma especialização em termos do traço [genérico]/[arbitrário]: clítico SE [+genérico] e 3PP [+arbitrário];
a um emprego de mais estratégias com a implementação de formas pronominais nominativas que se tornam as mais utilizadas na fala especializada web-mediated, no século XXI, com uma especialização em termos do traço [genérico]/[arbitrário]: SE, VOCÊ, A GENTE, NÓS, EU [+genérico] e 3PP [+arbitrário];
Aquilo que se registra na passagem do século XIX ao século XX é que nos gêneros escritos e mais monitorados, apesar da implementação das formas pronominais nominativas, se registra ainda o uso de estratégias mais padronizadas: SE+3P e 3PP, que são formas muito raras na fala culta urbana e quase extintas na fala popular do PB (Marins, Soares da Silva e Duarte, 2017).
De fato, nos gêneros escritos ou falados [+monitorados], que fazem parte das nossas amostras, temos um quadro bastante articulado e complexo, que inclui tanto formas conservadoras, em desuso na fala culta urbana, quanto formas inovadoras. Esse set de estratégias confirma, nas palavras de Kato (2019), “que o brasileiro letrado se comporta como um bilíngue fazendo uso da gramática falada atual/inovadora e da gramática da escrita (...) em um processo de code-switching”, principalmente na escrita e em gêneros falados [+monitorados].
Podemos concluir confirmando quanto já apontado por Kato (2005, 2019), Duarte (2007, 2023) e Duarte e Serra (2015), entre outros, que, também no que diz respeito às estratégias de indeterminação do sujeito, a gramática do falante culto urbano brasileiro não corresponde exclusivamente a uma gramática padrão, “nem a uma gramática de um falante letrado do passado” (Kato, 2005, p. 136). O que emerge no falante culto urbano brasileiro contemporâneo é uma competição de gramáticas, devido à possibilidade de ter acesso indireto a “uma periferia marcada onde valores paramétricos opostos ao da gramática nuclear podem estar presentes, (...), valores esses que podem assumir um valor competitivo, durante a escolarização” (Kato, 2005, p. 131).
Alice Girotto



